【摘 要】
:
近年来,针对数据流的挖掘研究已成为数据挖掘领域中一个新的研究热点。和传统静态数据库中的数据不同的是,数据流具有连续的、无限性、和实时性的特点,使得传统的频繁模式挖
论文部分内容阅读
近年来,针对数据流的挖掘研究已成为数据挖掘领域中一个新的研究热点。和传统静态数据库中的数据不同的是,数据流具有连续的、无限性、和实时性的特点,使得传统的频繁模式挖掘算法难以适用。这对挖掘数据流中的知识带来了新的研究挑战。本文主要针对数据流挖掘中的一些问题展开研究,主要内容如下:首先,对数据流挖掘技术及其特点进行了介绍,然后对数据流挖掘的基本概念及其关键问题进行了介绍,最后对数据流挖掘的几个典型算法进行了研究。其次,提出了基于滑动窗口的数据流频繁闭合模式挖掘算法—PCFI算法。该算法通过将滑动窗口分割为若干个基本窗口,以基本窗口为更新单位,使用提出的前缀滑动窗口树PCFI-tree来挖掘基本窗口内的频繁闭合模式。挖掘时,将频繁模式存储到同一PCFI-tree中,同时删除PCFI-tree上过期的及不频繁闭合的模式分支。挖掘和更新滑动窗口中的所有频繁闭合模式是在PCFI-tree中同时进行。这个实验的结果显示,本算法具备较良好的性能。在论文的最后提出了一个在倾斜时间窗口中的数据流最大频繁模式挖掘算法MMFIDS。MMFIDS基于在倾斜时间窗口,在这其中,对数据进行存储和处理采用了位对象数据、位频繁树IFP-tree和存储树PTTW-tree等,由此可以针对数据流中的新老事务的不同作用挖掘出最大频繁模式。本实验结果显示了该算法的良好性能。
其他文献
随着移动通信技术和全球定位技术(GPS)快速发展,越来越多的空间对象需要处理位置随时间变化的应用需求。如何有效跟踪和管理空间中的移动对象,成为研究的热点。然而在现实应
无线传感器网络综合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,能协作地监测、感知和采集各种环境或监测对象的信息,并进行处理,最终将信息传送给感
目前,ARINC-429数字信息传输规范已成为航电设备之间数字传输工业标准,但在ARINC-429数据传输的多路总线接口设计中大多数还采用中断形式实现。由于中断引脚资源有限导致设备扩
计算机辅助检测(Computer-aided detection, CAD)是指用数字图像处理技术和计算机视觉技术等,帮助医生解读海量图像,获得有价值的诊断信息。CAD系统不仅有助于提高医生诊断的
随着信息技术的高速发展,移动通信工具的使用已经渗透到人们日常生活的各个方面,同时人们对于移动通信网络服务质量要求越来越高。随着用户群的不断增大,移动通信网络所承受
无线传感器网络是由大量分布的不同规格和功能的具有感知、计算和通信能力的微型传感器节点通过自组织的方式构成的一个以数据为中心的无线网络。大量传感器节点通过相互之间
本文以面向行程时间预测的公交车GPS数据挖掘为主题,围绕该主题,进行了相关内容的研究。论文共分七章。第一章给出了本论文的相关研究背景和意义、研究现状和论文主要研究工
计算流体力学(Computational Fluid Dynamics,CFD)采用数值计算方法针对复杂流动问题进行求解以发现各种流动的现象和规律,已经广泛应用在航空、航空、气象等领域。格子Boltzma
序列模式挖掘技术研究作为数据挖掘与知识发现领域的重要分支,它的目的是发现有趣的序列事件,为理论或实际应用提供数据支持。不同于传统序列模式挖掘思路,负序列模式提供了
随着互联网的高速发展,网络信息量大幅增长,面对海量数据信息用户无法快速有效地获得对自己有用的信息,即“信息过载”问题,搜索引擎和推荐系统是解决“信息过载”问题的重要