多维关联规则挖掘的研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:chengyingying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库应用的不断深化,数据库的规模急剧膨胀,但是数据库管理系统却没有提供有效的工具和方法来利用这些数据,因此充分利用数据进行决策支持成为当今最需要深入研究的领域。数据库的知识获取以及数据挖掘便是数据利用的有力武器。在数据挖掘中关联规则的挖掘获得了广泛的关注,因为其表达方式易于理解,高的可用性,成为各企业尤其是零售业最为关注和最常应用的数据挖掘技术。关联规则是从历史的大规模的数据中获得项集之间的相互关联关系,抽取出有用的和感兴趣的模式,主要任务是发现数据库中的大项集,因为这个任务在大规模数据库基础上是耗时的操作,所以现在的主要研究方向都集中在大项集的有效生成上。 本文提出了一种新的数据结构——多维谓词集项集树MPIT(MUlti-dimension Predicate Itemsets Tree)和基于此结构的高效的多维关联规则产生算法。MPIT记录了数据库中所有的维谓词信息,同时将数据库按不同的维谓词分割成了一系列很小的子集,然后对各子集部分建立有序大项集树。实验表明本算法在时间和空间上都有很高的效率。在此基础上提出了结合元规则指导、概念分层和数据方技术的改进的挖掘算法,使以后的挖掘工作更具有针对性,更加迅速。
其他文献
随着网络技术的发展和Internet的广泛使用,ERP系统对企业的发展正起着越来越重要的作用。ERP的实施离不开网络,也正因为如此,网络的安全性也就影响着ERP的安全性。其中数据完整
INTERNET的发展与TCP/IP协议是密不可分的,因为互连的计算机之间传输数据主要靠TCP/IP协议来传输,而TCP/IP协议的套接字(Sockets)是支持TCP/IP协议的网络通信的基本操作单元。可以
从中国网络基础设施的现实条件出发,该文研究了一类特殊的元计算,即所谓的GridRPC计算.该文的主要研究内容和贡献如下:(1)针对局域网上的并行计算透明性差和计算容量有限的问
计算机视觉在基于运动的目标识别、人机交互、汽车自动导航、智能视频监控等方面有着广泛的应用,而视频运动目标检测和跟踪是计算机视觉的重要组成部分。在实际的视频运动目
性能评估技术对于并行系统的设计、制造和使用有非常重要的意义.为了对并行系统的性能评估技术进行进一步的研究.该文首先试图阐述对并行系统进行性能分析必须考虑的各种问题
随着WWW的普及,以Web访问日志的形式存储在Web服务器上的大量数据对于理解用户的网络访问行为模式无疑是一个重要的资源.Web日志挖掘就是将数据挖掘的有关技术应用于Web日志,
目前我们使用的IP电话,实际正是这种窄带和宽带网混存的假IP电话,之所以说它是"假IP电话"是因为它的网络通讯过程还没有完全脱离传统的电话网,IP电话是IP网与公用电话网相结
随着视频数字化技术的广泛应用,视频服务系统中的存储"瓶颈"也日益突出.因此,如何实现高性能的视频存储系统成为人们研究的热点.目前,提高存储系统性能主要有两个切入点:提高
互联网络自从诞生以来,已经成为人们日常生活中不可或缺的一部分,人们可以通过网络查询信息,获取资讯,甚至寻求帮助。但互联网络的开放性和信息多样化正使得网络安全问题显得
科学计算可视化技术的核心是三维空间数据场的可视化,散乱体数据是一种重要的三维数据类型.为大尺寸散乱体数据可视化开发高效、精确和易于实现的算法一直是科学计算可视化领