序列模式挖掘算法的研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:lxw19831201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先提出了一种带有时间间隔约束的序列模式挖掘算法。此算法在PrefixSpan算法的基础上,对第一层投影数据库的构造方法进行了扩展,并在搜索频繁项时绑定了时间间隔约束,从而得到满足时间间隔约束的序列模式。在挖掘带有时间间隔约束的序列模式时,此算法的性能明显优于GSP算法。其次,提出了一种基于模式增长的泛化序列模式挖掘算法。此算法的基本思想是首先搜索频繁项,然后通过递归地挖掘投影数据库得到相应的泛化序列模式子集,并在构造投影数据库和序列模式增长过程中直接引入滑动时间窗口和时间约束,从而得到泛化序列模式。此算法继承了模式增长算法的优点,其性能明显优于GSP算法。最后,提出了一种新的多维序列模式挖掘算法。此算法首先在序列信息中挖掘序列模式,然后针对每个序列模式,仅在包含此模式的元组的多维信息中挖掘出相应的多维模式,从而缩小了搜索空间。对于多维模式的挖掘,本文基于H-tree结构提出了一种新的快速有效挖掘方法。在维度较高时,此算法能获得优于UniSeq算法的性能。
其他文献
本文深入分析了IP网络多播安全问题,归纳出IP网络多播安全威胁的特点,目前IP网络针对多播技术缺乏有效的保护和控制。然后介绍利用IP多播发起的拒绝服务攻击,并对现有的解决方
  本文研究了服务器集群系统中的一些关键技术,并针对数字图书馆服务请求中对服务器资源与网络带宽耗用比较大的特点,以负载平衡算法中较优的加权最小连接数调度算法为原型,设
  由于网络的开放性和不可信任性,移动代理系统面临的种种安全问题已成为移动代理走向广泛应用的瓶颈。其中,恶意主机或执行平台对执行代理的攻击最为广泛亦最难防御。为了解
二十世纪八十年代以来,人们开始借助大规模计算机来求解各类复杂问题。在科学、工程和商业计算领域,还有很多问题难以用现有的超级计算机解决,如需要处理的海量数据资源分布
随着存储空间的增大和存储价格的下降,即使是一个较小的P2P用户群也会共享大量的数据。大量的共享资源使得P2P系统吸引了大量的用户,但困难的是如何在大量的共享资源中寻找用户
本文对MPLS BGP/VPN在路由器上的实现及多层VPN在企业网中的应用进行研究,内容如下:第一章为前占部分,主要是简单介绍与本论文相关的课题背景、工作内容以及工作成果和论文结构
传统的网络设备大多采用基于GPP或ASIC的嵌入式处理器。随着网络流量的迅速增长和网络业务的日益多样,它们在性能或灵活性上已难以满足应用需要。在这种背景下,兼具高速处理
本文研究现有的网络层安全服务框架IPSec,肯定其在网络层提供安全服务的优势,针对抵御报文假冒攻击所提供的数据源验证服务,分析其中不足之处,如无法提供安全的IP地址等。在面
随着新一代高通量测序技术的高速发展,研究人员可以在短时间内,以低廉的价格,同时对多种微生物基因组进行测序,从而获取大量的生物测序数据。宏基因组学的研究学者直接从环境样本
  本文提出一种对XML文档建立索引的新方法。该方法支持分支查询和带有通配符的查询。同时设计了一种通过一次遍历XML文档就可以建立索引的算法,XML文档被看作一条线,文档中