【摘 要】
:
当今社会随着信息产业的高速发展,信息系统中所储存的数据量越来越大,而人们逐渐从管理数据的单一需求,发展到想通过历史数据总结出所感兴趣的规则,来对未来的行为起到一定的
论文部分内容阅读
当今社会随着信息产业的高速发展,信息系统中所储存的数据量越来越大,而人们逐渐从管理数据的单一需求,发展到想通过历史数据总结出所感兴趣的规则,来对未来的行为起到一定的促进作用,于是数据挖掘技术应运而生。然而传统的数据挖掘算法在面临挖掘大量数据时,效率亟需提高,所以需要对数据挖掘技术中的关联规则生成算法进行分析,并在Apriori关联规则算法的基础上提出新的基于图挖掘的对Apriori算法的改进算法。以垂直数据格式表示法为启发,对Apriori算法中数据库的储存方式进行了改进。同时基于图挖掘,对候选频繁项集的挖掘做了相应的改进,可一次操作将所有的候选频繁项集全部挖掘出来。该改进算法对长事务集以及事务数据量较大的情况下的数据挖掘效率的提升比较明显,所以适合对长事务集以及大数据量数据进行挖掘。理论需要实践来验证,故通过设计一套基于改进算法数据挖掘系统,并通过统计算法运行时间与传统Apriori算法进行比较,以检验Apriori改进算法比之原算法在运行时间上的缩短。以此来验证该Apriori改进算法在对数据进行挖掘的效率以及时间上优于传统的Apriori算法。
其他文献
随着网络信息技术的飞速发展,用户可以通过网络方便快捷地利用海量的共享信息,同时“信息爆炸”、“信息过载”、“信息垃圾”等很多问题日趋严重。而且那些无用或者有害信息
KTA是基于H.264视频编解码标准而建立的一套实验模型,它在H.264原有的基于块的运动补偿和变换的编码框架基础上,研究新技术以进一步提高视频编解码效率。KTA是介于H.264和新
随着银行业务的不断发展,从以前的客户存款、取款、贷款等等到当今的家庭各项费用开支(包括水费、电费、煤气费等等)、小额贷款都可以通过银行来办理。现金收发管理设备,诸如
作为模拟仿真领域目前研究的热点问题之一,气体泄漏扩散过程仿真日益受到关注。从国内外的研究现状出发,分析和比较了当前常见的气体泄漏扩散仿真模型的优势和不足。针对这些
年龄是人的重要属性。近年来,用户年龄自动估计技术逐渐成为一个涉及模式识别、计算机视觉、语音识别和机器学习等领域的活跃课题。该技术在现实世界中有很多应用,如法医学、电
当今的制造系统正受到高要求快变化的环境形势所挑战。工业企业必须实施控制政策以及调整自己的制造系统,以最大限度地提高生产率、降低成本和提高质量,同时还要应付强大的竞
肝脏是人体内最大的实质性脏器,以代谢功能为主。肝脏内部管道系统交错重叠,包括门静脉、肝静脉、胆管及肝动脉,存在很大的变异性。为了全面、准确地了解肝脏内管道系统的情
随着智能体理论与技术的发展,多智能体系统在科学研究、互联网、生产控制、金融服务、企业管理等诸多领域中有了较广泛的应用,但在执行效率和效果上依然存在很大的提升空间,而面
图像自动标注隶属于计算机视觉、模式识别、信息检索以及机器学习等领域,在学术界和工业界均得到高度的关注,但是由于图像自动标注存在数据集的不平衡性,底层视觉特征与用户高层
随着经济的高速发展,交通运输业也得到了飞速发展,车辆数量越来越多,但是随之而来的交通问题也日益突出,这使得智能交通(Intelligent TransportationSystem,简称ITS)系统成为研究