一种效用模式的数据流挖掘方法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:collinccs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据化社会的逐步建立,数据库信息系统在各行各业中扮演的角色也愈发的重要。数据库信息系统在保存了大量的数据的同时,也隐藏了诸多不易发现的有价值信息。在保证准确性的前提下如何挖掘出这些信息就成为了重要的课题。因为静态数据库已经满足不了现实应用,数据流挖掘技术也就应运而生。与静态数据挖掘不同的是,数据流的连续性、无限性、高速性以及分布改变等特性对挖掘技术提出了更高的要求。同时,效用模式挖掘是一种在效用条件的前提下进行的数据挖掘。因此,在数据流中进行效用模式挖掘是一个非常有现实意义的课题。本文延续了频繁项集挖掘,数据流挖掘和效用模式挖掘的研究。针对在数据流中进行效用模式挖掘的问题提出了MMIDS方法,该方法在数据流中寻找最大高效项集。本文设计了一种称为最大高效项集树的树形压缩结构,并使用该结构在界标窗口模型和滑动窗口模型进行了算法实现。接着,为了解决遍历最大高效项集树的效率问题,本文提出了一种自下而上的遍历策略来减少遍历节点的数量。最后一点,因为现实世界资源的有限特性,所以MMIDS方法使用了针对最大高效项集树的剪枝策略来适应数据流挖掘的资源有限条件。论文的最后是实验部分。为了评估MMIDS方法的性能,实验从运行时间,空间开销,扩展性和自下而上遍历策略的有效性等方面进行分析,并且与MHUI-TID方法和THUI-Mine方法进行比照。实验结果表明,MMIDS方法在运行时间,空间开销以及扩展性上都有了明显的改进。同时,MMIDS方法使用了有效的剪枝策略,这样在有限资源的条件下,该方法更能满足现实世界中数据流挖掘的需要。
其他文献
近年来,时滞神经网络已经广泛应用到模式识别,信号处理,联想记忆,全局优化等领域。众所周知,神经网络的设计必须很大程度的依赖于系统本身的动力学属性。因此,时滞神经网络动
在软件系统建模领域,面向对象的建模方法已经占据了主流地位。然而,面向对象建模方法,都存在如下几个问题:(1)已有的面向对象建模方法常常把目光集中在建模元素上,而不关注与
近年来,现代科学技术迅猛发展,传感器依赖的科技,如嵌入式技术、无线网络通信技术、微机电技术等日新月异,能够民用的无线传感器网络应用也逐渐出现在人们视野。目前,我国对
随着数据收集技术的发展,海量数据时代已经到来。当今社会商业竞争异常激烈,人们迫切希望从海量数据中,提取有用的信息以帮助进行商业决策。但是,传统的数据分析和数据挖掘技术在
带容量限制的基于质心的Voronoi图(CCCVT, Capacity Constrained Centroidal Voronoi Tessellation)在普通Voronoi图的基础上加入质心限制和容量限制,可生成符合容量约束的CV
随着科技信息的发展,数字图书馆已经成为图书馆建设的主流方向。数字图书馆中存储的海量信息为数据挖掘提供广泛的应用空间和更高的技术要求。如何高效地利用数据挖掘技术挖
数据挖掘是在大量的数据中提取出人们可理解的、存在潜价值的知识、模式、规则或规律的过程。离群检测与聚类分析是数据挖掘领域中研究非常热门的两个研究课题。这两个课题相
无线传感器网络是由大量的传感器节点以自组织的方式构成的无线网络,其部署区域可能包括危险的工业环境如井矿、核电厂等,因此,在网络运行过程中节点的能耗成为最为关注的热
随着IT技术的飞速发展给我们生活带来大幅改变的同时,伴随而来的信息安全问题也给我们带来越来越大的困扰,特别是计算机软件和数字媒体这类极易被复制、被盗版的特殊商品的保
二十世纪九十年代,随着全球定位系统的应用,更远距离、更高带宽的无线数据传输系统的出现以及计算机和电子技术的高速发展,人类开始开发和测试更加复杂的水面无人艇(Unmanned