数据流频繁闭项集挖掘算法研究

来源 :兰州理工大学 | 被引量 : 4次 | 上传用户:hy3508
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流的出现给传统的数据挖掘技术带来了巨大的挑战。由于数据流连续不断的到来,已有的数据处理技术难以对这些潜在无限的、变化的数据进行有效的管理和挖掘。随着移动终端设备的广泛应用,数据流应用领域不断增多,因此,必须对数据流环境下的数据处理技术进行研究。目前,数据流挖掘技术引起了国内外学者的广泛关注,成为当前的一个研究热点。频繁项集挖掘是数据流挖掘的主要研究内容,被广泛应用于关联规则发现、冰山查询、分类和聚类等问题。针对传统的方法大多关注于在数据流中挖掘全部频繁项集,存在数据和模式冗余问题,近年来人们开始关注在数据流中挖掘频繁闭项集。本文在对数据流挖掘领域若干问题进行探讨的同时,主要研究了数据流中频繁闭项集的挖掘问题,提出了新的算法并结合实验结果做了必要的分析。概括地说,本文主要涉及到如下几方面内容:1.与传统的关系型数据库相比,分析了数据流的特点。按照算法处理数据流时所采用的不同时序范围对数据流处理模型进行了介绍,并对目前常用的数据流处理技术进行归纳总结。2.对数据流挖掘算法的特点及其模型进行了分析和总结,对当前数据流挖掘算法作了介绍。对数据流频繁项集挖掘的经典算法作了详细的分析,了解数据流挖掘过程中的存储结构和存储方法,以及概要数据结构的生成、维护和实时查询结果等方面的内容。3.频繁闭项集不仅包含了频繁项集的全部信息,而且在数量上远小于频繁项集,在实际应用中更容易被人们理解。本文研究了数据流环境下的频繁闭项集挖掘问题,提出了一种新的基于滑动窗口处理模型的频繁闭项集挖掘算法,来挖掘最近一段时间内用户感兴趣的信息。并将它们存储到一种新的数据结构中,随着滑动窗口的不断滑动以基本窗口为更新单位实时更新和维护该结构,利用该结构可以快速地挖掘出滑动窗口中所有频繁闭项集。
其他文献
BP(Back Propagation)神经网络是目前人工神经网络中最具代表性和应用最广泛的模型之一。其结构简单,可操作性强,能模拟任意的非线性输入输出关系,在模式分类,图像处理,决策支持等
目前的森林火险等级预测方法是天气专家根据温度和湿度等数据给出火险等级,其结果很大程度受到人为因素影响,其精确性和时效性不足,而且森林险等级是由气象台所测数据分析的,根据
在信息化社会,每天都有大量的信息产生,信息量过大势必造成信息冗余,因此造成效率下降。人们迫切希望有一个智能识别信息的载体来帮助人们对事物有选择性的认知。行为识别是
近年,计算机技术的迅速发展和广泛普及,改变了人们传统的生产、生活和管理方式,同时也为违法犯罪分子提供了新的犯罪手段和空间。以计算机信息系统为犯罪对象和工具的新型犯罪活
随着智能化时代的到来,机器视觉技术,图像处理技术与人工智能飞速发展,极大推动田间智能除草技术不断发展与更新。智能除草装置相比传统的人工除草方式有很多优点,已成为农业
基因芯片可以同时检测一个生物样本的所有转录因子活性。与传统的实验工具不同,基因表达芯片能够使我们对细胞在基因水平上有一个全局的认识。该技术已经被广泛应用到很多领域
近年来,互联网发展迅速,但与之相伴随的是网络安全事件的频繁涌现,互联网络中安全威胁的范围越来越大,DDoS、扫描、蠕虫等大规模攻击已经给人们的正常工作、学习、科研带来严
本文的研究目的是通过对眼动信息的分析来进行前庭功能的检测。眼震数据分析是前庭功能检查的客观依据之一。本文利用的方法是通过对眼动视频图像进行处理,从而获取眼睛瞳孔
随着射频识别(RFID)技术在各个领域应用越来越深入,RFID技术正在引导着行业的发展,影响着人们的生活。各国政府、科研机构和企业都在积极进行RFID技术的研究和开发。RFID阅读器
随着当今信息科学的不断发展和进步,信息交互变得日益频繁,信息安全也就成为了最突出的问题之一。通信安全作为信息安全的重要组成部分,理所当然的受到了广泛的关注和研究。