无重叠的三支序列模式挖掘

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:me272206010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无重叠的序列模式挖掘是序列模式挖掘的一种重要挖掘方法,不仅能够灵活地表达用户的需求,而且满足Apriori性质,运用该性质还能够避免很多无效的计算,从而提高挖掘的性能。然而现有的算法并没有考虑用户感兴趣的属性,导致挖掘结果中包含了大量用户并不关注的频繁模式。为了解决这一问题,本文研究了无重叠的三支序列模式(Nonoverlapping three-way sequential pattern,NTP)挖掘,该挖掘方法将用户感兴趣的属性分为强、中和弱三种程度。因为模式只能由强和中字符构成,所以无重叠的三支序列模式挖掘可以避免挖掘出大量冗余的频繁模式。更为重要的是,NTP的间隙约束只能匹配中或者弱字符,因此可以有效的避免出现与模式之间存在较大的偏差。为了高效的挖掘出所有的NTP,本文提出了一个有效的算法,被称为无重叠的三支序列模式挖掘(NTP-Miner)算法。该算法主要包括两部分:模式支持度计算和候选模式生成。在支持度的计算过程中,运用深度优先和回溯策略不需要创建一棵完整的网树,因此也无需创建很多无效结点和双亲关系,从而提高了计算模式支持度的效率。在候选模式生成方面,NTP-Miner算法采用模式连接的方法,通过限制挖掘出的模式只能由用户感兴趣的强和中字符构成,有效地减少了候选模式的数量。本文的主要研究内容如下:1.本文研究了NTP挖掘问题,该挖掘方法不仅提高了挖掘的性能,并且避免了挖掘出用户不关注的频繁模式。2.本文提出了高效的求解算法NTP-Miner,它主要包含两个步骤:模式支持度的计算和候选模式的生成。NTP-Miner算法主要采用深度优先和回溯策略,创建单根网树来计算模式的支持度,并且采用模式连接策略有效的减少候选模式的生成数量。3.本文在大量真实的序列数据集上进行实验,结果证明了NTP-Miner算法不仅有更好的挖掘性能,而且能够挖掘出对用户有意义的模式。在股票数据集上,分别证明了三支间隙、三支序列模式和无重叠条件的优势。除此之外,本文提出的NTP挖掘方法应用于聚类中也取得了较好的效果。
其他文献
作为表征学习的一个重要领域,网络表征学习成为网络科学和数据挖掘领域的重要研究问题。经典的网络表征学习方法主要可以分为基于随机游走的方法、基于矩阵分解的方法和基于自编码器的深度学习算法三大类。其中,基于自编码器的深度学习算法虽然可以有效的发挥深度学习的强表示能力,但是存在两大严重问题。首先,该类算法的输入维度和所采用的深度自编码器的结构通常都与网络的规模严重耦合,因而无法高效的应用于大规模网络的表征
学位
《信息网络传播权保护条例》确立的“通知—删除”规则曾在网络服务提供者网络版权侵权认定中发挥过积极作用,但也存在适用场域限于著作权领域、适用的网络服务提供者类型较少、适用措施仅限于“移除、断开链接”等问题,难以适应规制网络知识产权侵权的现实需要。而旨在修正“通知—删除”规则的“通知—必要措施”规则在司法适用中也存在法律适用顺序、合格通知标准、必要措施的选择等问题。上述问题的解决对网络服务提供者在网络
学位
不论是在理论上,还是在司法实践中,违约精神损害赔偿制度一直以来都是倍受争议的话题。《民法典》第九百九十六的创新之举再次引起了理论与实务界对该制度的审慎思考与热烈讨论。确立违约精神损害赔偿制度是为了对人的精神权益给予更周密和更高程度的保护,实属实践之迫切需要。因而,本文以《民法典》第九百九十六的规定为中心展开论述,研究我国的违约精神损害赔偿制度。除引言和结语部分外,本文分为以下五个部分:第一部分介绍
学位
近年来,不同发展阶段的目标检测算法层出不穷,不少学者越来越关注目标检测算法面向工业界的应用,尤其是算法对实际场景是否有足够的鲁棒性。遥感图像是航空器或航天器在高空采集的俯瞰航拍图像集,对地球资源调查与开发、国土整治、环境监测、以及全球性研究有着重要的实用性价值。遥感图像的目标检测对于计算机视觉和数字图像处理方向的很多任务都有很重要的应用价值,因此具有很高的研究意义。随着人工智能技术的迅速发展,基于
学位
通过运行序批式生物反应器与摇瓶实验相结合方法,在进水中投加不同数量Ca2+(0~200mg/L),考察了Ca2+在好氧颗粒污泥形成中的作用.当SBRⅠ、Ⅱ进水Ca2+含量分别为30、100mg/L,运行20d后,两反应器中均出现了好氧颗粒污泥.运行前50d,SBRⅠ中颗粒污泥浓度MLSS与污泥沉降指数SVI指标明显好于SBRⅡ;运行80d后,SBRⅠ、Ⅱ中污泥浓度MLSS均稳定在7.5g/L,SV
期刊
人脸表情迁移是计算机图形学角色动画领域的一项关键技术,可应用在电影制作、人机交互、虚拟现实等诸多领域。随着深度学习的发展,人脸表情迁移的深度生成模型替代了传统计算机图形学方法,提高了泛化能力。同时,基于生成对抗网络(Generative Adversarial Network,GAN)的人脸表情迁移为生成清晰的人脸表情图像提供了生成器与判别器博弈对抗生成的新思路。本文通过对生成对抗网络及其相关理论
学位
现实工程应用中常受数据采集设备、成本等的制约,导致数据集正负样本比例失衡,由此引发后续分类识别准确率低等问题。在众多解决方法中,最简易有效的是通过数据生成方法平衡正负样本比例。目前不平衡学习多集中于处理二分类失衡数据,但实际样本数据常具有多属性多类别的特点,因此,研究多类别不平衡学习问题具有实际应用价值。之前的研究工作中,多类别失衡数据生成过程的设计都是基于样本整体分布,而未考虑多类别失衡数据集中
学位
涉及计算机程序的发明在满足构成技术方案、具备实用性或其他条件下能授予专利权已逐渐成为共识。当下,如何为涉及计算机程序的发明提供更适宜的保护规则以实现制度目的、适应行业发展及满足发明人的权益保护需求成为新的重点问题。本文第一部分主要从涉及计算机程序的发明的概念、可专利性审查标准和权利要求撰写类型演变三方面对涉及计算机程序的发明进行基本介绍。第二部分主要从立法和司法两方面介绍我国涉及计算机程序的发明专
学位
报纸
准确客观地衡量科研学者的学术水平是一项至关重要的任务,目前各种基于图的排名算法如Page Rank算法等,已经被广泛应用在同构网络中,针对单一类型实体进行排名,但不适用于异构网络。虽然科学排名算法发展迅速,但仍有一些问题值得进一步研究。第一个问题,传统的算法都是应用于同构网络中,可是新的研究已经证明,使用混合或异构网络的排名效率更高。第二个问题,以往的研究只考虑了研究者的平均绩效,而忽略了研究者的
学位