周期间隙约束的序列模式挖掘研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:a63421118
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列模式挖掘作为数据挖掘的一项重要研究内容,用于从各应用领域的海量数据中发现所隐含的各种规律并从中获取有价值的知识和信息。周期间隙约束的序列模式挖掘是一种带有间隔约束的序列模式挖掘问题。它要求模式的项与项之间满足用户指定的间隔约束,且间隔大小或范围均相同,即挖掘形如p0[M,N]p1...[M,N]pj...[M,N]pm-1的频繁模式(M和N分别表示最小和最大间隙)。与一般的序列模式挖掘问题相比,周期间隙约束的频繁模式更具灵活性和有效性,因此周期间隙约束的序列模式挖掘成为了现代序列模式挖掘研究领域的一个重要研究方向。本文主要针对周期间隙约束的序列模式挖掘算法进行研究,以进一步提高频繁模式的挖掘效率。本文的主要研究内容和相关工作如下:(1)总结了周期间隙约束的序列模式特点及一般的挖掘方法,详细介绍并分析了已有的挖掘算法MPP、MGCS和AMin。针对已有算法所存在的缺陷,本文提出了采用不完全网树结构来计算模式支持度的方法并设计了相应的算法INSupport。(2)依据算法INSupport,结合栈和队列数据结构提出了两个高效的挖掘算法MAPB(Mining sequentiAl Pattern using incomplete Nettree with Breadth first search)和MAPD(Mining sequentiAl Pattern using incomplete Nettree with Depth first search)对现有算法进行改进。实验结果表明,MAPB算法和MAPD算法较现有的挖掘算法在运行时间性能上均具有大幅度地提高。其中,MAPD算法性能最佳,不仅运行速度更快,而且空间消耗也最小,能够对很长的序列迅速地完成挖掘任务。(3)详细介绍了周期间隙约束的Top-K模式挖掘问题及解决该问题的方法,提出了基于MAPB的启发式Top-K挖掘算法MAPBOK(MAPB for tOp-K)。虽然该算法不能准确地得到各模式长度下的前K种最频繁模式,但当序列较长时,实验表明其能够在极短的时间内获得较高正确率的结果集。
其他文献
该论文以中国上市公司的重组作为基本研究对象,在公司重组的基本理论、公司重组动因的理论回顾的基础上,对中国上市公司重组的发展历程作了概括,对重组的发展趋势及改革过程
图像匹配与图像分割始终是图像处理技术中的重要研究课题,该文针对基于点特征的图像匹配定位问题及前视红外(FLIR)目标图像的分割问题开展的研究.
三维重建作为计算机视觉的一个重要研究方向,一直是计算机视觉研究的热点,在理论研究和实际应用上都具有重大的价值.该论文主要围绕着基于参数模型的三维重建在以下几个方面
该文首先分析了低空飞行与回避时,飞机所需的各种地理信息和其它信息.建立起局部区域内低空飞行和低空突防需要信息的数据库.主要包含两大类信息,即地理信息和社会人文信息.
该文主要研究了无人直升机的三维动画仿真,阐述了有关三维图形学,OpenGL原理与应用,VC++编程技术,网络通讯等内容.
该文首先简要介绍了图像压缩编码的原理和主要方法,介绍了有关图像压缩编码的国家标准.在对实时视频编码芯片MPEGS420的结构和操作方式进行分析的基础上,设计了基于IBMMPEGS4
该文以纺织行业国家级重点项目—华茂集团管理信息系统建设为背景,对基于客户机/服务器结构的管理信息系统设计的有关问题进行了研究.主要内容包括以下几个部分.在管理信息系
该文以胶囊药片图象为例,根据药片胶囊出现缺陷时图象呈现的各种可能性,分两部分来进行图象的特征提取.一方面,考虑到有缺陷的药片可能会在图象中产生明显的色彩变化.针对这
印刷行业要相民步入一个科学管理和科学营销的时代,不革除一些管理和营销方式上的弊端是无法实现这一目标的.该文拟用掌握的现代管理及营销理论来全面部析中小型印刷企业的管
论文从实际出发,结合开发经验,对纺织行业MIS开发的需求分析、数据库设计、统计计算的调整、以及一些在实施中的技术问题做了全面的探讨,最后谈了项目开发中的一些体会.由于