数据流频繁模式挖掘算法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:ZAQWSX12344321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据流模型是近年来出现的、一种新型的数据模型,广泛应用于网络监测、传感器网络数据分析、Web点击数据流分析、金融行业和商业交易管理数据等中。数据流的连续、快速、无限、未知的特点决定了传统的数据挖掘技术已经不适合数据流挖掘,分析和挖掘数据流已经成为热点研究问题。数据流频繁模式挖掘是数据流挖掘的基础研究之一。首先介绍了数据流频繁模式挖掘的国内外研究现状,并阐述了课题研究的背景和意义。针对研究的内容,详细介绍了数据流频繁模式挖掘的基础知识和相关技术。针对现有频繁项集挖掘算法存在搜索空间大、需要保存中间结果等问题,本文提出了挖掘滑动窗口中最大频繁项集的算法MFI-BET。该算法采用位图存储数据流中的数据降低了存储空间,并采用位运算加快了数据的更新。在挖掘阶段,除了采用经典的剪枝策略外,提出一个新的剪枝策略,与经典的MAFIA算法中的剪枝策略相比较,该剪枝策略缩小了搜索空间,加快了搜索的速度。实验结果验证了该剪枝策略的有效性和正确性,及MFI-BET算法的适应性。针对现有Top-k频繁项集挖掘算法只是考虑数据流入,没有考虑数据的流出,本文提出了一个滑动窗口中的Top-k频繁项集挖掘算法MTKFI。在数据更新时考虑了数据的流入和流出,挖掘时基于Apriori思想,利用位图信息多次迭代得到当前滑动窗口频繁项集。同时,把得到的频繁项集存储到一个双层索引链表中。实验结果表明MTKFI算法能够有效的挖掘滑动窗口中的最k个频繁项集。
其他文献
随着计算机的不断发展,硬盘作为计算机中的核心组成部分其发展速度也非常惊人。当前主流硬盘的容量越来越大、存储速度越来越高,但是作为存储数据的核心设备它的固件模块安全
伴随着当代科学技术的迅速发展及交通事业的需求,智能交通系统已成为现今人们关注的热点问题。车辆识别系统作为智能交通系统的重要组成部分,在桥梁路口自动收费、停车场无人
随着网络结构复杂性的增强,如何在扩展规模不断加剧的网络环境中高效地配置网络设备,已经成为网络管理领域中的焦点问题。目前设备厂商用的最多也是最传统的网络配置方式是命
随着系统功能的逐渐完善,视频联网监控平台目前已在我国各行业领域投入大量应用。视频联网监控系统在基本完成数字化与网络化后,由集中式向分布式、集散式发展,由人工干涉的
随着当代信息科技不断地更迭,地理空间数据渐渐演变为一种备受瞩目的信息资源。电子海图作为地理空间资源中的一种,在国家经济,国防建设等方面起到了非常重要的作用。但是电
随着计算机技术和多媒体技术的迅猛发展,人们越来越容易制作和存储数字视频,并且在通信与互联网普及的今天,数字视频在网络上的传播也更加容易,在全世界范围内形成了海量的数
随着Internet的普及以及网络技术、信息技术和传媒技术的飞速发展,网络教育教学模式应运而生,由于学习主体因素的特点,这种模式更多的应用在高等教育中。在许多高等院校国家
随着嵌入式技术的发展和无线通信技术的广泛应用,以移动智能终端为载体的移动地理信息系统(Mobile GIS)已成为地理信息系统研究的热点。移动GIS是集导航、定位、地图查询和空
近年来,网络技术飞速发展,网络攻击复杂化问题日益凸显。但是复杂的网络攻击往往隐藏在大量的普通网络攻击之间,使得现有实时入侵检测系统(IDS)难以发现复杂的多步攻击。因此
随着计算机应用的普及,软件质量成为软件工程最为关心的问题之一,软件测试作为软件质量的有效保障而备受关注。统一建模语言(UML)以其可全方位描述软件系统蓝图的优势,在众多