动态的关联规则挖掘算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:xgzyf2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则是数据挖掘的一个重要研究方向,用于寻找数据库中不同项或属性间的相关性。而在关联规则中最常使用的方法为Apriori算法,但其存在一些缺点,例如,产生大量的候选项集,需多次扫描数据库等,从而造成Apriori算法的计算效率比较低。后续虽有许多研究针对这些缺点做改进,但大多未脱离Apriori算法的整体框架,以致其执行效率并无很大的改进。除此以外,在关联规则挖掘中还普遍存在两个问题:1.用户在挖掘关联规则的过程中需要预先设置挖掘参数来获取想要的规则,但往往需要通过多次调整这些参数才能达到预期的目的,如何在参数多次调整中进行高效的挖掘? 2.当挖掘的数据库不断更新时,如何高效及时地挖掘出有趣的关联规则?传统的关联规则挖掘算法大都是静态的,对于上述问题,需要对数据库重新进行挖掘,执行效率不够高。本文首先针对第一个问题,提出一个新的关联规则挖掘算法,称为EUF算法。该算法通过一个子集模组的对映,至多扫描两遍数据库即可计算出出现在数据库中的所有项目集的支持数,最后再由使用者输入最小支持度阈值和置信度阈值产生关联规则,算法效率不受支持度大小的影响,并且在支持度调整时无需重新扫描数据库,所以执行效率平稳快速。针对数据库更新的情况,本文在EUF算法的基础上提出EUF-IU增量更新算法,不论数据库怎么变动,只需要扫描变动的那部分数据,即可挖掘出数据库更新后的关联规则,节省了时间耗费。实验证明,本文提出的两个算法能随着参数和数据库的变化,进行动态关联规则挖掘,两个算法的执行效率在支持度较小时优于传统的关联规则挖掘算法,尤其优于QDT算法。
其他文献
随着通信和计算机技术的不断进步,人们已经不再满足于通过有线途径传输数据,在某些场合下更期望能在无线的条件下实现数据传输。本文旨在研究并实现无线局域网范围内视频数据
随着软件行业的发展,软件的规模越来越大,复杂度也越来越高,为了保证软件的质量,软件测试在软件开发过程中重要性越来越大,软件测试也花费越来越多的人力、物力以及时间。在
在移动终端电池能量有限的无线Ad Hoc网络中,设计一个能量有效的延长网路生存时间的节能路由协议已经成为当前研究的重点和热点。目前提出的节能协议大都基于理想的无线信道
基于文字计算的群组决策是模糊决策研究中的一个重要方面,是现代决策科学的一个重要研究领域,其理论和方法在方案实施、城市规划、经济管理、金融投资、工程评价和军事决策等
随着网络的发展,网络上的信息量不断增加,为了让人们能够方便地从海量信息中获得所需信息,搜索引擎技术应运而生并不断发展壮大。人们开始探寻各种各样的排序算法,意图把与用户查
学位
对人类感觉信息的理解和描述是当前人工智能研究中的热点和难点,人类从外界获得的信息中,80%是通过视觉得到的。尽管在计算机视觉领域,目标检测已经研究了几十年,但仍是一个
Internet的发展为电子商贸的快速成长提供了良好的平台。引入多Agent技术可以有效地提高电子商贸的智能化程度。然而,由于多Agent系统的动态性和开放性,系统中某些Agent受利益
随着网络开放化应用和面向服务计算技术的兴起,软件系统的形态、生产方式、运行和使用方式都发生了巨大的变化。未来的软件系统将会运行在由一组软件服务协同工作的环境中。W
随着网络规模的扩大,网络流量特征的相关研究已经成为网络性能分析最主要的方向之一。通过对网络流量特征的研究,可以为预测网络性能、QoS服务和SLA服务等应用提供必要的支持