关系数据库关联规则挖掘算法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:ycbydd21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的快速发展,全球范围内的数据存储量急骤上升,面对这一挑战,数据挖掘技术应运而生,关联规则挖掘,尤其是关系数据库关联规则挖掘作为其中的一个重要研究内容,其应用极为广泛。目前关系数据库关联规则挖掘的的常用方法是通过算法产生出一些可能的模式,然后通过计算数据库中符合这些模式的元组数,如果超过规定的元组数即为想要的模式。这方面比较常见的算法是Apriori算法和它的一些常用的变型。这种方法在处理关系数据库关联规则挖掘的时候会碰到一些问题:首先伴随着处理问题复杂度的升高给系统带来难以承受的负担;其次因为算法没有充分考虑关系数据库关联规则挖掘的特点,所以在面临一些复杂模式的关系数据库的时候无法进行挖掘。本文就是在这种情况下写出的,文中首先介绍了数据挖掘的过程和分类,接着重点介绍了关联规则的相关理论及其在关系数据库当中的应用,在此基础上,通过结合倒索引结构和概念格等技术,给出了一种新的关系数据库关联规则挖掘算法,这种算法一方面保持了原有经典Apriori算法的简单易行的优点;另一方面通过引入了倒索引结构,将全表扫描的次数减少为一次,从而提高了算法效率,通过提出了连接度等概念和一些新的方法,让算法用能力处理较为复杂的关系数据库上的关联规则挖掘。通过引入概念格的概念,在规则衡量阶段减少了数据库扫描次数,进一步提高了算法的效率。通过论证,发现这个算法具有适用面广,快速,高效的特点。文章的最后,对全文进行了总结,提出了算法还存在着的问题和今后应该继续努力的研究方向。
其他文献
随着NGN技术的发展,VoIP业务作为一种网络服务呈现出广阔的应用前景,VoIP是通过分组交换网络传输语音、视频和数据等业务,可以满足人们日益丰富多彩的需求。实现VoIP系统涉及
XML(Extensible Markup Language)即可扩展的标记语言,是一套定义语义标记的规范,其目的在于定义计算机和人都能方便识别的数据类型。随着网络应用的快速发展,XML已经被广泛
应用层组播在应用层以多个单播的方式来实现组播,这种方式虽然绕开了网络层的限制,但是以消耗网络带宽资源和主机资源为代价的。因此,大规模的应用层组播一般只能实现一对多
用户界面是软件系统的重要组成部分,是用户和计算机之间沟通的桥梁。界面开发的质量和效率,成为影响软件产品质量的一个重要因素。然而开发图形用户界面GUI的工作量和难度十
随着互联网的高速发展,多媒体信息的急剧增加,人们迫切希望能够快速高效地获取所需要的多媒体信息。有效地组织、管理和检索大规模的多媒体信息成为迫切需要解决的问题,其中
网络环境的复杂多变使得Web服务本身具有诸多不确定因素,同时Web服务的可用性也时常发生动态变化;用户期望可以在体验服务流程过程中,随时随地的提出更多个性化的需求,以上诸
随着信息化时代的不断发展,对发掘异构模式之间语义一致性的要求日益迫切。模式匹配作为模式操作的第一步,在数据集成、数据转换、模型管理、电子商务、语义Web等领域都起到
随着计算机网络技术的迅速发展,网络安全问题已成为当前网络技术研究的重点。理论和实践分析表明,诸如计算机病毒、恶意代码、网络入侵等渗透行为之所以能够对计算机网络产生
车牌识别是一项应用非常广泛的技术,在人们的生活中发挥着重要的作用。车牌定位、字符分割和字符识别是车牌识别的三个重要阶段,且是车牌识别技术的研究重点。本文从这三个阶
系统模拟和虚拟化技术对当今计算机科学研究和相关产业有着重要的影响,整合模拟和虚拟这两个计算环境是一项具有挑战性和有意义的工作。利用两者环境各自所具有的优势,一方面