保序序列模式挖掘

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:peterpan984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是一种随时间推移进行测量记录的数据。从时间序列中挖掘有用模式在许多领域应用广泛,例如股票分析、疾病检测和天气预报等。为了发现模式,现有的方法通常将时间序列的数值型数据转换为另一种形式以降低时间序列的维度,如标准化/符号化形式,但此做法不可避免地会使数据偏离原始数值,并且一定程度上破坏了时间序列的连续性;此外,现有的挖掘方法主要侧重于寻找特定的模式,而忽略了时间序列的数值的大小次序关系。为解决这些问题,本文基于时间序列的数值的次序关系,提出保序序列模式(Order-Preserving sequential Pattern,OPP)来表示时间序列的趋势变化,并提出了OPP挖掘方法,通过在原始时间序列里找出频繁的保序模式,获得时间序列中频繁出现的趋势变化。本文的主要研究内容如下:1、本文研究时间序列的频繁保序序列模式挖掘问题,并提出OPP-Miner算法挖掘时间序列中所有的频繁保序模式,该算法主要由两大关键问题构成:支持度的计算和候选模式的生成。2、为了有效的计算保序模式的支持度,OPP-Miner算法采用过滤和验证策略,过滤策略可以避免对冗余子序列的无效验证,验证策略可以通过数值之间的次序关系来验证候选子序列是否为模式的出现;为了生成保序候选模式,OPP-Miner算法采用模式融合策略,通过将频繁模式两两融合来生成候选模式,有效的减少了候选模式的数量。3、考虑到在处理大型数据库时,OPP-Miner算法会挖掘出大量的频繁模式,为了减少冗余模式,本文还研究了最大保序序列模式挖掘问题,并提出高效的MOPP-Miner算法来实现对频繁模式集的压缩处理。4、本文在大量的真实时间序列上进行了实验,结果验证了OPP-Miner算法在时间序列数据增大的情况下仍具有良好的运行效率和可伸缩性;并验证了MOPP-Miner算法具有良好的压缩能力且OPP-Miner算法能发现时间序列中的相似子序列;更重要的是,实验结果表明,本文所提算法能够通过识别关键趋势来帮助分析COVID-19疫情发展态势,并在提高聚类性能方面具有较高的实用性。
其他文献
近些年,在深度学习理论的推动下,面向遥感智能解译任务的目标检测技术得以迅速发展,并被广泛应用于自然灾害监测、城市规划、军事情报获取等领域。然而,随着遥感数据量急剧增加,遥感图像呈现出背景复杂的特点,这在一定程度上削弱了遥感图像中重要的目标特征。为增强目标特征在遥感图像中的显著性,从而有效地抑制复杂背景对目标检测的影响,当前许多算法基于卷积神经网络去构造多级融合特征,并借助于各种有效的场景辅助信息,
学位
提高空气质量分析的科学性及预测的准确性,可以帮助政府提升对空气质量评价、管理及决策的可靠性,从而及时采取有效的防控措施规避大气污染造成的损害,保障公众健康。同时也可以保证公众享有信息参与和环境监督的权利,配合政府进行管控工作。因此,积极开展空气质量预报工作对于社会发展具有重要的战略意义及价值。影响空气质量的因素繁多且包含时空维度以及复杂的非线性关系信息,而基于现有的预测模型研究主要存在两点问题:一
学位
微表情是一种快速的、无意识的自发式面部表情,它能够揭示人们内心试图隐藏的真实情感。近年来许多人利用计算机视觉技术对微表情识别系统进行研究,使得微表情自动识别的应用范围越来越广,但微表情持续时间非常短,并且微表情引起的面部肌肉运动的强度变化细微,只出现在面部很小的区域,正确理解并识别微表情有着相当的难度,这在一定程度上限制了微表情识别算法的性能。为了解决上述问题,本文提出一种融合时空网络与注意力机制
学位
本文作者为缅甸来华留学生,因此选择了缅甸媒体作为研究对象,对其中关于“一带一路”主题的新闻报道进行框架分析,试图通过研究,发现缅甸媒体对于相关主题的报道特点和倾向。这项研究不仅可以为缅甸媒体的相关报道进行学理性分析,并对新闻实践有所助益;同时也能将缅甸媒体所呈现的对“一带一路”的社会认知进行中文语境书写,这对于未来中国的“一带一路”建设也具有一定的参考价值。在2013年,中国提出了“一带一路”的倡
学位
报纸
图像是现代生活中信息载体的一种常见形式,完好的图像才能实现信息传输的完整性。但是,经常会出现所需的图像文件破损或被遮挡的现象,例如旧照片的破损以及监控中所需内容的被遮挡等。修复破损图像是一项具有挑战性的任务,其目的是根据破损图像中已知内容对破损区域进行填充。目前关于图像修复的研究很多,可以分为传统方法与深度学习方法两大类。传统方法可以对破损区域较小的图像进行简单的修复,基于深度学习的修复方法相较于
学位
大数据时代已经悄然来临,数据的快速流通与高效共享对于促进世界经济发展,提高各国政府国家治理能力起到不可替代的作用。与此同时,跨国商业巨头规模的迅速扩大,导致了商业巨头们跨境收集用户隐私及非法利用数据的情形频繁发生,由此引发了各国政府及民众对于公众隐私面临泄露,国家数据主权遭受侵扰的担忧。跨境电子数据的泄露更是对国家数据主权的严重践踏,造成的损失更是难以计量的。近期频频爆出的知名互联网企业非法收集客
学位
我国现今对土地征收补偿的研究主要集中在土地征收补偿的标准上,认为确定具体的土地征收补偿标准是平息土地征收纠纷的最优解,实际上厘清土地征收补偿范围也能起到定分止争的作用。除引言和结语外,正文共分为以下五个部分。第一部分为概念简介。首先,点明了补偿的涵义是弥补损失,损失是补偿的前提。其次介绍了征收补偿范围,简要阐述了补偿范围、征收范围与征收补偿标准三大概念的联系与区别。最后,介绍了直接损失和间接损失的
学位
结直肠癌(Colorectal Cancer,CRC)是一种具有高度侵袭性的肿瘤,其致死率位居全球第三位。深入研究结直肠癌的致病机制、研发结直肠癌的新型药物已成为一个亟待解决的问题。橘皮素具有抑制细菌和抗肿瘤等药理作用,但橘皮素治疗结直肠癌的分子水平作用机制尚未得到深入研究。因此,本文基于生物信息学和网络药理学方法,研究橘皮素治疗结直肠癌的各类分子标志物、潜在的基因靶标和相似功能药物,并首次提出了
学位
近年来,神经影像技术用于退行性疾病的计算机辅助诊断受到越来越多的人关注。脑影像技术为人类全面理解大脑组织结构提供丰富的信息。多图谱脑影像分析方法利用多个脑图谱间的信息互补关系,以提取判别性信息能够帮助医生找出病变机理。但目前多图谱脑影像分析方法面临一些挑战,如脑影像样本数量少,脑影像数据特征维度高、难以保留脑影像数据结构特性等问题。如何在样本较少的前提下选取脑影像数据内部的潜在判别信息以及保留样本
学位