【摘 要】
:
时间序列是按照时间顺序产生和记录的一组序列数据,在任何时间、任何地点,人类活动和自然界中均在不断产生时间序列,这使得时间序列分析成为了数据挖掘领域中一项重要的研究内容。深度学习目前已成为时间序列分析中广泛使用的方法,并在多种任务上产生了较好的表现。但由于深度学习是一种数据驱动的方法,时间序列数据集中广泛存在的类别间不平衡现象和有标签数据的缺乏限制了深度学习模型的性能。本学位论文针对以上问题,采用自
【基金项目】
:
国家自然科学基金(62162062)“时间序列深度表征学习中的关键技术研究”;
论文部分内容阅读
时间序列是按照时间顺序产生和记录的一组序列数据,在任何时间、任何地点,人类活动和自然界中均在不断产生时间序列,这使得时间序列分析成为了数据挖掘领域中一项重要的研究内容。深度学习目前已成为时间序列分析中广泛使用的方法,并在多种任务上产生了较好的表现。但由于深度学习是一种数据驱动的方法,时间序列数据集中广泛存在的类别间不平衡现象和有标签数据的缺乏限制了深度学习模型的性能。本学位论文针对以上问题,采用自监督学习策略构建训练模型的代理任务,在利用孪生编码器实现时间序列数据增强的基础上,提出基于孪生特征提取器的时间序列表征方法,使特征提取器在不利用标签信息的情况下,提取高质量的时间序列表征,降低下游任务数据分析的难度。首先,根据时间序列中广泛存在的相位偏移和幅值变化现象,提出了基于孪生编码器的自监督学习方法,通过最小化时间序列之间的动态弯曲距离与通过孪生编码器得到的嵌入向量之间的欧氏距离,使嵌入向量在深度欧氏特征空间中的移动可以产生相位偏移和幅值变化现象,并使深度欧氏特征空间与动态时间弯曲相互匹配。其次,在时间序列嵌入向量基础上,提出了两种时间序列数据增强方法。一种是基于添加随机噪声的数据增强,该方法通过对时间序列嵌入向量添加随机噪声使对应的时间序列产生相位偏移和幅值变化,避免了对时间序列的结构和特征信息的破坏。另一种是基于随机线性插值的数据增强方法,该方法基于动态时间弯曲寻找待插值时间序列样本的近邻样本,并通过待插值样本和其近邻样本对应的嵌入向量之间进行随机线性插值,使寻找近邻与随机线性插值的过程更符合时间序列数据的特性。最后,利用提出的时间序列数据增强方法设计了自监督对比学习框架,使特征提取器能以端到端的方式进行时间序列表征提取。该框架首先通过两个独立的数据增强操作将时间序列样本变换为两个不同的增强视图,其次利用两个增强视图中一致的结构和特征信息,通过最小化增强视图对应的表征向量之间的相似度,使特征提取器能够生成高质量的表征向量。为了验证本文提出方法的有效性与合理性,本文在多个数据集上进行了验证。实验结果表明,本文提出的两种数据增强方法均能有效提升数据集的规模与质量,不仅在一定程度上弥补了时间序列数据集类别间的不平衡对模型的影响,同时能有效缓解有标签数据不足的问题。本文提出的表征方法不仅可以在多个任务上实现与目前表现最优的基于深度学习的有监督模型相当的性能,而且能在标注数据不足的情况下产生比有监督模型更好的性能。此外,多领域应用验证实验的结果表明本文提出的表征方法能灵活应用在来自不同领域的时间序列数据上。
其他文献
目的:探讨在慢性肾脏病(Chronic kidney disease,CKD)非透析患者体内成纤维细胞生长因子-23(Fibroblast growth factor-23,FGF23)、Klotho蛋白(Klotho)含量与矿物质代谢异常及左心室肥厚(Left ventricular hypertrophy,LVH)的关系。方法:选取2021年2月至2021年8月就诊于延边大学附属医院并明确诊断
目的:龋齿以及其他口腔问题在低龄儿童中具有较高的发病率,与口腔管理不当有非常密切的关系,本次研究对我院日托班入园前儿童进行口腔保健管理模式,并分析这种方式的应用效果。方法:选取本院2019年1月至2020年12月日托班入园前的120例0~3岁低龄儿童为研究对象,根据口腔保健管理模式的不同分为对照组和观察组,各60例。对照组儿童采用常规管理模式,观察组儿童采用强化口腔保健管理模式,比较两种模式的应用
<正>意大利裔的美国演员阿尔·帕西诺在影片《闻香识女人》中扮演了双目失明的弗兰克中校。弗兰克中校是曾经的英雄、总统的幕僚,但双目失明后自暴自弃,决定最后一次享受生活然后自尽。他成功饰演这一角色并凭借该片表演获得第65届奥斯卡金像奖最佳男主角和第50届金球奖最佳男主角。他向来不走保守路线,喜欢更具挑战性的角色,把每一次表演都当作是第一次表演。一、电影表演中被忽视的“表情动作”阿尔·帕西诺在影片中贡献
现如今深度学习技术已经应用到了各个领域中,在计算机视觉领域中已经占据了主导地位。图像识别是计算机视觉领域的基础任务,大多数视觉任务都需要根据图像识别的结果来进行下一步操作,所以对图像识别的研究尤为重要。近几年我国进入大数据时代,随时随地都会产生海量的图像数据,如果可以得到充分利用,将大大推动基于图像识别的深度学习技术的发展。但是,现在的深度学习技术主要使用标记数据进行训练,除了少量人工标记的数据外
问题式教学是用“问题”整合教学内容,以问题为纽带,引导学生运用地理思维方式进行情境问题探究解决的一种教学方式。本文以“交通运输方式和布局变化的影响”为例,围绕创设问题情境、设计问题链、迁移运用等内容,探寻更好地培养学生地理学科核心素养的路径。
朝鲜语古籍是记录朝鲜族数千年发展历程中有关历史、政治、文化等信息的重要载体。先进的古籍文字检测方法和技术可以促进朝鲜语古籍文本图像的再生性修复、文字识别等古籍数字化相关环节。目前国内有关汉语、藏语、蒙古语以及彝语等古籍文字检测和数字化工作成果显著,但是朝鲜语古籍的数字化进程严重滞后,有关朝鲜语古籍文字检测方法的研究文献非常少。朝鲜语古籍文字检测面临着各种挑战,一是混排的汉语和朝鲜语的字体形状、书写
随着科技的快速发展,用电量的增加,具有高载流能力、低损耗、体积小的超导电缆就显得尤为重要,但交流损耗会导致超导电缆中产生热量进而增加制冷成本,导致超导电缆无法大规模使用。因此如何降低交流损耗,在超导电缆的研究中一直是一个重要问题。超导线材是制作电缆的关键材料,高温超导电缆的高温超导带一般是由超导线材围绕在支撑柱上组成的圆筒形结构。因此超导线材的结构也会影响到超导电缆的磁场分布,进而影响到交流损耗。
随着社会经济的发展,人们的生活水平在不断地提升,与此同时,也产生了很多不良的生活习惯,导致心血管病发病率持续增高。通过心音听诊可以及时发现心血管疾病患者,提高心血管疾病的治愈率。而我国医疗资源相对短缺且分布不均衡,部分地区难以实现医生与患者一对一开展心音听诊的需求,并且准确的心音听诊需要医生有着较深的知识储备和听诊经验,听诊结果还会受到听诊器和医生主观判断的影响,因此使用计算机辅助医生进行心音听诊
电感是电路中实现振荡、滤波、延迟、耦合等功能的重要电子元件,在电子电路中起着非常重要的作用,因此电感参数的测量技术一直被广泛的关注。现有的电感测量仪更注重对电感值和等效内阻的测量,而在实际电子产品设计中往往要考虑电感的耐压值、饱和电流,以及电感是否发生虚焊和及匝间短路等异常情况。鉴于现有电感测量仪存在的上述问题,提出了一种企业使用环境条件下的电感参数特性检测仪设计方案。首先提出了一种电感测量方法,
目的:通过采用刚地弓形虫(简称弓形虫)RH株速殖子,体内感染雌性BALB/c小鼠和体外感染小鼠小胶质细胞系(BV2细胞),建立小鼠急性弓形虫感染和小胶质细胞活化模型及BV2细胞/Neuro-2a(N2a)神经瘤母细胞共培养体系,探究舍曲林对弓形虫感染激活小胶质细胞活化诱导神经元损伤的干预作用及其机制,为弓形虫中枢神经系统疾病的治疗提供科学依据。方法:1)体内实验:选用雌性BALB/c小鼠作为研究对