【摘 要】
:
序列模式挖掘是数据挖掘的一个重要研究领域,其中带通配符约束的序列模式挖掘越来越受到人们的关注。带通配符的频繁序列模式挖掘,是传统频繁序列模式挖掘的自然推广,它允许挖掘
论文部分内容阅读
序列模式挖掘是数据挖掘的一个重要研究领域,其中带通配符约束的序列模式挖掘越来越受到人们的关注。带通配符的频繁序列模式挖掘,是传统频繁序列模式挖掘的自然推广,它允许挖掘出的频繁模式中含有通配符,使得人们可以挖出具有特定特征的序列模式。带通配符的频繁模式挖掘不仅具有理论研究价值,而且在文本索引、数据流挖掘、生物领域等领域有着巨大的应用价值。本文以提高序列模式的挖掘效率为目的,分别针对不同类型数据库,研究高效的带通配符约束的序列模式挖掘算法。
本文的研究内容以及相关工作包括以下几个方面:
1)首先介绍并分析了三类经典的序列模式挖掘算法:基于Apriori性质算法、基于模式增长的算法以及基于比较思想的算法,这些算法是带约束限制的序列模式挖掘算法的基础。分析了序列模式挖掘算法在引入通配符约束的可行性,详细介绍了已有的带通配符约束的序列模式挖掘算法Gap-Bide和MPP,其中前者基于高效的模式增长思想,后者基于Apriori算法引入的和候选集合产生和测试思想,并作出评价。
2)提出了一种基于模式增长和序列迭代比较的PreDisc-all算法,将其应用到带通配符的序列模式挖掘中,可以分别应用于序列数据库和一条单序列中挖掘序列模式。实验表明,在平均长度较短的序列数据库中或者单序列中,挖掘具有通配符约束的较短的频繁序列模式,该算法在时间效率上有着不错的表现。
3)设计和实现了带通配符约束的算法实验系统。
其他文献
三维模型的形变一直是计算机图形学领域的重要研究方向,相关的技术在动画和游戏领域也有着广泛的应用。而近年来消费级深度相机的普及也使得基于深度相机的研究与应用越来越多
SERCOS(Serial Real-time Communication Specification,串行实时通讯协议)协议是一种专门用于在工业机械电气设备的控制单元与数字伺服装置之间实现串行实时数据通讯的协议标准
近年来,随着嵌入式系统结构的日益复杂化,传统手工式的嵌入式软件开发方法已经不能适应市场的需求。基于组件的软件工程方法在通用领域的大量成功应用使得人们开始将目光转向其
近年来,随着智能手机、平板电脑等移动设备的不断发展与快速进步,手机成为人们最常用的图像/视频采集、处理和存储工具。但是智能手机、平板电脑等移动设备在运行计算复杂的
手语是有听力障碍的人互相交际和交流思想的一种重要工具。但是当今社会中信息传播的主要方式都是建立在自然语言之上,对听力障碍者接受信息、融入社会主体造成极大的困难。手
随着P2P文件共享软件的广泛应用,P2P网络中不良信息的传播和相关P2P网络的盗版侵权等现象也不断增多。为了使P2P技术在应用领域充分发挥作用,P2P文件共享网络管理系统成为近
随着网络和信息技术的发展,各个应用领域的合作越来越密切,数据的互操作性日显重要。由于不同数据源的数据模式的自治性与异构性,为实现数据共享,模式匹配已成为数据密集型分
在图像处理中,图像分割是一种重要的图像分析手段,目的在于将图像划分为具有不一致性特征的区域并提取图像中有意义的或人们感兴趣区域,是后续图像处理的基础。在计算机视觉
数字水印技术是数字产品版权保护的主要方法之一,也是信息隐藏技术的一个重要研究方向。数字水印技术最初的主要研究内容是图像水印技术,取得了众多研究成果,在视频水印技术
随着网络的普及、信息技术和电子商务的蓬勃发展,电子商务协议的研究越来越深入。交换协议是电子商务协议中很重要的一部分,通过对交换协议的建模和形式化分析来研究交换协议