基于数据流的频繁模式挖掘应用研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:fangtietie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流是一种海量并潜在无限的、连续快速的、并随着时间快速变化的有序数据序列。由于数据流本身的特性,使得传统的频繁模式算法难以适用。作为数据挖掘研究领域的热点之一,频繁模式挖掘已成为数据流挖掘中的基础任务,并得到了广泛的深入研究和应用。  针对数据流特点,论文概述数据流挖掘的研究背景及主要任务,并对数据流现状、处理模型、处理技术和关键问题进行了分析研究,并对一些现存的数据流频繁模式挖掘经典算法进行了介绍和总结。  在此基础上,本文提出了一种基于数据流的实时近似频繁项挖掘算法ECP-Stream和基于滑动窗口的数据流闭合频繁项集挖掘算法WHCFP-Stream。ECP-Stream算法使用ECD-tree结构保存数据流中频繁项,随着数据的流入不断更新结构,同时提高删除过期数据的时间效率,并保证输出数据的精度,满足在线实时处理的分析要求。理论分析和真实数据及模拟数据实验结果表明该算法具有很好的效率。基于滑动窗口模型的WHCFP-Stream算法采用WHCFP-tree结构保存数据流中的闭合频繁模式,随着数据流的流入,采用深度优先遍历删除过期数据,并简单快速的插入新的闭合项集。理论分析和真实数据实验表明了该算法的有效性。
其他文献
电子机构作为人类代理组织的电子副本,为开放异构多自治主体系统的开发提供了一个比较系统的概念框架。但现有的电子机构模型对其中存在的各种信息流还缺乏有效地分析和规范,
计算机网络技术的飞速发展使得通过网络实时传输连续多媒体数据已成为可能,由此产生的大量实时多媒体应用对网络的服务质量(Quality of Service,Qos)提出了更高的要求。而路由
互联网在我国已成为人们生活中不可或缺的一部分,在互联网上存在着海量的数据,并且每天都在爆炸增长中,这些信息丰富且实时,还可以作为信息检索、数据挖掘等很多方面应用的基础数
随着当今手机设备的广泛应用,其应用深度和广度也不断加大,软硬件的开发及设计都需要更多的考虑。这其中最突出的问题就是众多新的功能和应用都需要大容量的存储支持,同时由于对
自20世纪60年代末蜂窝式移动通信问世以来,特别是近20年移动通信技术的快速发展,移动通信给社会带来了深刻的信息化变革,已成为最受青睐的通信手段。在移动话音业务已日趋饱和的
随着Internet的飞速发展,Web的出现改变了人们习惯的处理方式,也给数据库技术提出了必须面对的重要问题:即如何有效地存储和管理Web上的数据(文档),使其既能被高效地操作和维护,又
随着信息化、网络化的发展,计算机网络已经广泛应用到军事、科技、文化乃至社会的诸多领域,它己经成为国家的重要基础设施。然而随之而来的网络安全问题也日益凸现。对计算机安
学位
随着网络和多媒体技术的迅猛发展,数字视频的生产、复制和传播越来越容易。然而,在便利了合法使用者的同时,数字视频的版权保护也日益严重。数字视频水印技术作为一种有效的
随着空间技术的不断发展,更多的空间数据被使用,空间数据挖掘是从空间数据库中提取隐含的、用户感兴趣的空间和非空间的模式、普遍特征、规则和知识的过程。空间co-loctation模
最近几年,在全球信息技术革命和经济全球化的推动下,世界电信业发生了巨大的变化,发展和变革的浪潮席卷全球。随着国内电信企业的相继上市,国际电信企业的不断进入,国内电信行业的
学位