一次性条件下自适应高平均效用序列模式挖掘

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:STTELA
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一次性条件下序列模式挖掘是一种间隙约束的重复序列模式挖掘,并已广泛应用于许多领域。但是目前一次性条件下序列模式挖掘忽略了项的效用(价格或者利润),从而导致一些出现频率低但用户关注度高的模式被忽略。为了解决这个问题,本文研究了一次性条件下自适应高平均效用序列模式(self-adaptive High-Average utility Oneoff sequential Pattern,HAOP)挖掘,该挖掘方法有如下三个特征:任何两个出现都不能共享序列中任意字符;同时考虑模式支持度(出现次数)、效用和模式长度;用户不需要提前设置间隙约束。为了高效地挖掘出序列中的高平均效用模式,本文提出了HAOP-Miner算法。本文研究显示,在一次性条件下自适应地挖掘序列中的高平均效用模式具有较高的研究和应用价值。本文的主要研究内容如下:1.本文研究了HAOP挖掘问题,并提出了高效的挖掘算法HAOP-Miner,HAOPMiner算法包含两个步骤:模式支持度的计算与候选模式的生成。2.在模式支持度的计算时,首先提出了Pf(Positive filling)算法,通过正序填充队列的方法寻找一次性条件下的出现,但是该方法冗余地创建与删除结点。为了解决该问题,提出了Rf(Reverse filling)算法,采用逆序填充队列的方法避免了冗余结点的创建和无效结点的剪枝,从而实现了模式支持度的高效计算。3.在候选模式的生成时,由于高平均效用模式挖掘不满足Apriori(单调性)性质,本文提出了支持度下界的方法,并利用模式连接策略生成候选模式,从而实现了候选模式的高效剪枝。4.本文在DNA、病毒序列等长序列中的对比实验结果证明了HAOP-Miner算法不仅有更好的挖掘性能,而且能够挖掘出更有意义的模式。同时,在生物序列和销售数据集上进行实验证明了本算法的应用价值。
其他文献
人脸表情迁移是计算机图形学角色动画领域的一项关键技术,可应用在电影制作、人机交互、虚拟现实等诸多领域。随着深度学习的发展,人脸表情迁移的深度生成模型替代了传统计算机图形学方法,提高了泛化能力。同时,基于生成对抗网络(Generative Adversarial Network,GAN)的人脸表情迁移为生成清晰的人脸表情图像提供了生成器与判别器博弈对抗生成的新思路。本文通过对生成对抗网络及其相关理论
学位
现实工程应用中常受数据采集设备、成本等的制约,导致数据集正负样本比例失衡,由此引发后续分类识别准确率低等问题。在众多解决方法中,最简易有效的是通过数据生成方法平衡正负样本比例。目前不平衡学习多集中于处理二分类失衡数据,但实际样本数据常具有多属性多类别的特点,因此,研究多类别不平衡学习问题具有实际应用价值。之前的研究工作中,多类别失衡数据生成过程的设计都是基于样本整体分布,而未考虑多类别失衡数据集中
学位
涉及计算机程序的发明在满足构成技术方案、具备实用性或其他条件下能授予专利权已逐渐成为共识。当下,如何为涉及计算机程序的发明提供更适宜的保护规则以实现制度目的、适应行业发展及满足发明人的权益保护需求成为新的重点问题。本文第一部分主要从涉及计算机程序的发明的概念、可专利性审查标准和权利要求撰写类型演变三方面对涉及计算机程序的发明进行基本介绍。第二部分主要从立法和司法两方面介绍我国涉及计算机程序的发明专
学位
报纸
准确客观地衡量科研学者的学术水平是一项至关重要的任务,目前各种基于图的排名算法如Page Rank算法等,已经被广泛应用在同构网络中,针对单一类型实体进行排名,但不适用于异构网络。虽然科学排名算法发展迅速,但仍有一些问题值得进一步研究。第一个问题,传统的算法都是应用于同构网络中,可是新的研究已经证明,使用混合或异构网络的排名效率更高。第二个问题,以往的研究只考虑了研究者的平均绩效,而忽略了研究者的
学位
无重叠的序列模式挖掘是序列模式挖掘的一种重要挖掘方法,不仅能够灵活地表达用户的需求,而且满足Apriori性质,运用该性质还能够避免很多无效的计算,从而提高挖掘的性能。然而现有的算法并没有考虑用户感兴趣的属性,导致挖掘结果中包含了大量用户并不关注的频繁模式。为了解决这一问题,本文研究了无重叠的三支序列模式(Nonoverlapping three-way sequential pattern,NT
学位
遥感图像技术的发展促进了农业生产、预防自然灾害和军事预警等众多行业的发展。遥感图像目标检测是遥感图像解译的重要任务之一,是指在图像中准确地找到某类目标的位置。其输入为一幅遥感图像,输出为被检测目标的类别信息和坐标信息。遥感图像的尺寸往往是巨大的并且需要极高的检测响应速度。随着大规模的集成运算群的发展,使用先进的计算机技术处理遥感图像成为完成遥感目标检测任务的必要方法,故而针对遥感图像的目标检测算法
学位
近年来,随着专利数量的日益庞杂,从海量专利中获取有效信息已愈发困难,在此背景下,用于挖掘有效信息的推荐算法已逐渐应用到专利领域中。然而,作为推荐算法中的关键技术,文本聚类算法在推荐系统的应用过程中存在一定不足。首先,作为聚类算法的输入表征,功效特征在专利中十分重要,如何精确提取专利中的功效信息是目前面临的挑战。其次,在专利聚类分析方面,基于IPC分类分析的方法是粗粒度的,无法与专利内容紧密结合,不
学位
近年来,情感识别成为了人机交互领域的研究热点问题,通过人类情感表达时所产生的行为、生理和心理反应去量化、描述和识别不同的情感状态,根据情感表示模型利用音视频模态信息构建情感识别模型。情感是时序变化的,也是通过音视频模态进行表达的,在单模态情感识别虽然有了一定的研究成果,但音视频模态维度情感识别能够检测出细微情感变化,得到了越来越多的关注。而音视频模态维度情感识别中需要考虑如何进行不同模态情感信息的
学位
情绪对学生的二语和外语学习及其重要。自二十世纪七十年代以来,越来越多的研究者开始探索外语学习中的情绪问题。然而无聊作为表现最频繁的学业情绪之一,迄今并未得到像焦虑、愉悦或兴趣等其他情绪那样足够的实证关注,以农村中学为背景的研究就更为少见。为弥补前人研究不足,本文以控制价值理论为框架,旨在探索农村中学英语学习中的无聊现象以及当前在外语学习中无聊情绪的经历。具体研究问题如下:(1)农村初中学生在学习外
学位