【摘 要】
:
关联规则挖掘首要解决的是效率与伸缩性问题.由于数据挖掘任务所面对的数据集通常是由数以百万计的记录所构成的大型数据库或数据仓库,因此如何提高从大型数据库中挖掘关联规
论文部分内容阅读
关联规则挖掘首要解决的是效率与伸缩性问题.由于数据挖掘任务所面对的数据集通常是由数以百万计的记录所构成的大型数据库或数据仓库,因此如何提高从大型数据库中挖掘关联规则的效率和伸缩性,以便有效的降低计算的复杂性、提高算法的运行速度,便成为关联规则挖掘研究中的核心问题.同时,在关联规则挖掘中存在的一个问题是,那些支持度高的规则往往不是有趣的规则,因为这些规则中的很大一部分都可以利用用户所掌握的领域知识预测出来;并且,用户有时只关心和某个项目相关的规则而不是全部的规则.这里就可以对要挖掘的规则进行约束,关联规则挖掘中最基本的约束是项目约束(除支持度和信任度外).Eclat算法与Apriori算法相比,在运行时间上提高了一个数量级.该文介绍了含有项目约束的关联规则挖掘,并以Eclat算法为原型,讨论了如何将项目约束引入关联规则挖掘过程的问题,给出了基于Eclat的Eclat+算法,并将此算法与基于Apriori的Reorder和Direct算法进行比较,从理论上证明了引入约束后的Eclat+算法可以大大提高算法的效率.
其他文献
现代软件的开发过程中,体系结构设计越来越得到重视。软件体系结构不仅指导软件开发的各个过程,也能作用于开发后的软件生命周期阶段,尤其是降低软件维护与演化的高难度与高成本
随着云计算和大数据时代到来,存储系统的高可靠性和海量数据的高效存储成为存储厂商追逐的目标。鉴于单控存储系统在出现故障时会出现数据丢失、服务中断的问题,双控存储系统已
随着信息化社会的到来,数字化校园建设是高等学校发展的必然趋势,是高校建设的重要部分,是一项基础性、长期性和经常性的工作,其建设水平是高校整体办学水平、学校形象和地位
随着中国保险行业的发展,原有的保险行业信息平台已不能满足保险行业现代化运作的需要,更没有形成一个完整行业软件架构。保险行业应用软件,特别是核心业务系统一直处于各个公司
模型驱动架构(MDA)是由OMG新近推出的一个软件开发框架。MDA基于一个众所周知、并长期建立的思想,它把系统的业务功能模型和具体的平台实现模型分开,从而使得系统的业务功能从
本文主要介绍了面向对象建模技术、UML,以及在统一过程的指导下,使用Rose工具组织UML的各种视图,并结合安全管理信息系统,着重讨论了UML标准建模语言在软件开发活动中系统分
随着网络技术的迅猛发展,全球网络化已成为大势所趋,网络技术正日益广泛地被应用到社会的各个领域中,深刻地改变着人们的生活和习惯.但是人们在得益于信息革命所带来的新的巨
思维进化计算是模拟人类思维过程提出的一种很有潜力的新型演化算法。思维进化计算已成功应用于求解数值优化问题,对TSP、常微分方程组建模和Job-shop调度问题等非数值优化问
随着电子商务普及,电子商务环境下的应用不可能再以独立的自成体系的形式存在,必须与其他系统共享信息,包括企业内部的系统、企业内部与企业外部系统,甚至是世界范围的企业机
随着系统芯片(SoC)在整机系统中的广泛应用,许多外围扩展的功能设备需要与系统芯片连接.而系统芯片由于管脚数量、总线负载等方面的局限性已不能满足这种需求.在系统芯片中设