关联规则更新算法研究与应用

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:yuanshidemeng36
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(或知识发现)出现于20世纪80年代末,目前已经成为人工智能和数据库等领域的研究热点。它有着广阔的应用前景,并将在新的世纪里在各个领域发挥其强大的生命力。R.Agrawal等在1993年提出了关联规则问题,现在关联规则已经成为数据挖掘研究的重要方向,并且吸引了众多学者和专家的关注。关联规则挖掘的典型算法是由R.Agrawal等提出的Apriori算法。Apriori算法在计算侯选项目集的支持度时需要多次扫描整个数据库,而随着K的增大,不仅K维项目集的数目减少了,而且能包含这些项目集的事务也是很少的。由于数据规模大且时常更新,使得采掘效率较低,必须设计更有效的算法。另外,当数据库中增加新的数据时,现有的多数算法要重新扫描整个大型数据库,而且现有算法中项目集的支持度是基于整个数据库计算的,当新增的数据中出现新项目时,即使包含新项目的项目集频繁地出现,现有算法常把这些项目集作为非频繁项目集,由此产生的关联规则不能反映最近的商业活动。基于数据挖掘的研究现状和关联规则挖掘算法存在的问题,本文主要进行了以下的研究工作:(1)数据挖掘技术的分析与研究。在介绍数据挖掘基本概念的基础上,对数据挖掘与传统分析方法、数据库中的知识发现和联机分析处理做了深入地分析和比较,对数据挖掘的对象、可发现的模式进行了详细地分类、归纳和总结,对数据挖掘常使用的技术做了介绍和分析。(2)关联规则数据挖掘技术的分析与研究。在提出关联规则基本概念的基础上,本文对关联规则的种类进行了全面地分类、归纳和总结,对关联规则的典型挖掘算法及其基本思想进行了详细地归纳、分析和研究,对各算法之间的差别进行了客观地比较。同时,也详细地讨论了提高算法效率的各种优化技术,客观地分析了它们的优缺点和利与弊。(3)针对Apriori算法的不足,提出了一种新的关联规则的高效挖掘算法。新算法根据支持度对事务数据库进行筛选删除操作,使得在计算候选集支持度时,所扫描的事务数据库比原来的事务数据库小,从而提高整个算法的效率;同时,采用了一种新的产生候选集的算法,该算法避免了原有算法在产生候选集时,对频繁集的多次扫描,提高了效率。(4)作为一个应用,本文对CRM做了较全面地分析,结合数据仓库知识,探讨了如何把数据挖掘技术及关联规则挖掘应用于CRM中,辅助企业较好地管理客户。
其他文献
随着计算机技术、图象处理技术的不断发展,视频监控已经成为计算机视觉领域的一个重要研究课题,而运动目标检测与跟踪是视频监控的重要组成部分。本文基于全方位视觉设备获取
耳语音转换为正常语音在通信系统、安全保密系统、金融系统、医学等领域有着广泛的应用前景。汉语耳语音的转换目前仍处于研究的初级阶段,由于汉语耳语音与正常语音的巨大差异
现在的社会是信息社会,计算机网络扮演者越来越重要的角色,但如今黑客猖獗,入侵手段越来越隐蔽,造成的损失越来越大,网络安全越来越受到了人们的重视,传统的网络安全技术已经不能满
电视网、电话网和传统计算机网络合并为一个数字化、分组化的集成网络已经成为不可阻挡的趋势,密集波分复用技术为“三网合一”提供了高速通信条件,而现有的Internet所提供的
自20世纪80年代开始,世界上所有发达国家相继建成了国家级的教育和科研计算机网络,并成为这些国家教育和科研工作最重要的基础设施,从而促进了其教育和科研事业的迅速发展。1994
学位
针对目前骨架提取算法普遍存在的准确性与复杂度的矛盾,本文提出一种基于特征点求解的Reeb图骨架提取算法,创新地将提取特征点和Reeb图结合用于骨架提取,在保证骨架提取准确
遥感技术是20世纪60年代兴起的一种探测技术,它根据电磁波理论,应用各种传感仪器对远距离目标辐射和反射的电磁波信息,进行收集、处理,并最后成像,从而对地面各种景物进行探
伴随互联网爆炸性的发展,网上信息浩如烟海,普通网络用户想找到所需的资料难于大海捞针,所以迫切需要一种优异的搜索服务,将网上繁杂的内容整理成为可方便获取的信息。搜索引擎技
自然景物模拟具有复杂性和随机性,一直是计算机图形学和虚拟现实领域研究的热点和难点。它在动漫产业、影视业、游戏业、景区(园林)设计系统中应用非常广泛,本文认为景区设计系