基于机器学习的多元时间序列相似性搜索方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:hrbwqwq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列的相似性搜索,是根据给定的查询目标在时间序列候选数据中正确、快速查找到符合要求的数据。随着信息化技术的广泛应用,以及物联网技术的蓬勃发展,时间序列呈多元化的发展趋势,给相似性搜索工作带来极大挑战,主要体现为:(1)由于多元变量之间存在复杂的相关性,以及现有多元时间序列数据普遍缺少先验信息的数据现状,对多元时间序列相似性进行精确度量的难度较大;(2)传统的空间索引结构在处理高维数据时面临空间开销激增、查询效率降低的难题。针对上述问题,本文研究了基于机器学习的多元时间序列特征表示方法及相似性度量方法、探索了机器学习技术用于加速搜索过程的可行性。主要工作如下:(1)针对无标签情况下的序列特征表示问题,使用了自监督度量学习的方法解决了基于机器学习的特征表示对数据标签的依赖问题,通过基于分段线性近似的时间序列数据增强方法解决度量学习中的样本构造问题。通过改进的卷积神经网络与卷积注意力模块,结合Triplet Loss度量学习损失函数优化特征空间的数据分布情况,在保持数据相似关系的基础上将原始数据嵌入低维特征空间,并使用公开数据集对算法的有效性进行了验证。(2)针对传统空间索引在多元数据场景中空间开销大、更新开销大进而影响搜索效率的问题,提出了基于学习索引的多元时间序列相似性搜索方法,首先基于semi-hard采样策略进一步优化自监督度量学习过程,缩小特征空间中同类数据的类内间距,优化了特征空间的数据分布情况。随后引入学习索引方法,将原始数据对应的特征向量进一步投影为可排序的标量并基于该标量重新组织原始数据的存储位置。随后使用递归模型索引结构对标量的分布情况进行拟合,进而学习到高维数据的分布特征,并最终通过查询序列对应的标量值预测相似数据的存储位置。基于公开数据集的进行实验,验证了基于本文提出的特征表示方法与学习索引的相似性搜索方法的可行性。(3)梳理了现实应用场景中的使用需求,设计并开发了多元时间序列相似性搜索工具,整合了传统的多元时间序列比较方法以及本文提出的基于特征表示的相似度比较方法,实现了多元时间序列相似性度量及搜索,并在公开数据集上验证了可用性。
其他文献
深度神经网络是高效灵活的模型,可以很好地完成,如图像识别,自然语言处理、目标跟踪等各种任务。然而,随着深度神经网络研究不断深入,其自身网络结构愈发复杂,造成手动网络架构设计工作越来越困难。手动网络架构设计需要人类专家大量时间、脑力成本和深厚的相关经验,这在很大程度上制约了深度神经网络的发展。神经网络架构搜索在这样的背景下出现,利用日益增强的算力水平,结合目前已有的深度神经网络研究的先验知识,对复杂
学位
数字经济是实现双循环新发展的重要支撑力量,为区域创新创业提供了新的动力和契机。本文以城市创业活跃度为研究视角,利用2011—2018年我国地级市面板数据,探讨了数字经济对区域“促创业”的影响及其内在机理。研究结果表明,数字经济的发展可以提高城市创业活跃度水平。对于东部城市而言,数字经济对城市创业活跃度的促进作用会更加显著。机制分析表明,消费扩张效应和吸引FDI溢出效应是数字经济影响城市创业活跃度的
期刊
对地观测卫星是人类获取地球空间信息的重要载体,在经济建设、社会发展、国防安全等领域发挥着巨大的作用。卫星任务规划作为对地观测卫星工作流程的重要环节,对于提升卫星观测效率具有重要意义。多星任务规划问题通常包含收益最大化、约束条件满足、规划效率等子问题,直接利用单一模型进行求解比较困难且效率不高。若将该问题分解为若干个相对简单的子问题,在此基础上针对不同的子问题设计相适应的算法进行求解,有利于降低求解
学位
在受到技术封锁或发生战争等极端情况下,卫星导航定位系统极可能受到攻击,导致各种应用系统无法实现对自身的导航定位。利用广播信号、公共移动通信信号等普遍使用的民用机会信号可以作为补充卫星导航定位系统的有效技术手段,成为众多学者的研究课题。基于机会信号的自主定位技术分为基于几何关系和基于位置指纹的自主定位技术,其中基于位置指纹的自主定位技术因其成本较低、鲁棒性较高受到了广泛关注,它主要通过提取环境中能够
学位
区块链提供了去中心化、防篡改、匿名和公开透明的环境。由智能合约组成的去中心化应用程序为区块链的发展开辟了新的视野。人们在推动各种区块链去中心化应用落地的同时,一些诈骗者也利用区块链经营欺诈犯罪活动。他们将庞氏骗局伪装成以投资、赌博和游戏等形式的去中心化应用程序,并在网站上对其推广,使经验不足的投资者面临严重的财产损失风险。因此,检测区块链上的智能庞氏骗局成为当前区块链发展过程中亟待解决的关键安全问
学位
本文分析了现有控制监视系统结构设计上的不足,主要包括软件维护工作量大、显示信息量小、显示方式和手段不够丰富、缺乏数据分析和辅助决策等,研究了控制监视系统的相关技术,基于Qt平台和麒麟操作系统下,利用图形控件开发技术完成了控件库的设计、编码、开发和测试工作,设计开发了一套跨平台、可定制、易于扩展的图形组件动态库。该库中的控件采用矢量图绘制,利用Qt的信号槽机制,设计了易于交互的行为。控件具有统一的属
学位
针对医院医疗服务不到位的现状,以长沙市中心医院为例,通过对长沙市大型综合性三级甲等医院的患者开展问卷调查,知悉患者对医院提供的医疗服务的满意程度,探究影响患者对医院提供的医疗服务的满意程度的主要因素,分析研究促进医院管理水平提升的对策。根据上级医疗卫生行政政策、考核重点内容和医院需求编写《长沙市中心医院满意度调查问卷》对长沙市中心医院2019年上半年的门诊、住院患者或患者的家属共计2658人展开跟
学位
凝胶性作为大豆蛋白最主要的性质之一,在生活与工业上的应用非常广泛。为了进一步深层次了解大豆蛋白凝胶性的影响因素,本试验从大豆(齐黄34)籽粒中分离出7S和11S大豆球蛋白,对7S球蛋白进行了分离,获得αα’-亚基和β-亚基。控制7S与11S大豆球蛋白的比例为1:1,调整7S球蛋白中50%的亚基构成,制备不同7S亚基比例(β-亚基与αα’-亚基的比例分别为0:1、1:4、2:3、3:2、4:1和1:
学位
功能梯度碳纳米管增强复合材料(Functionally Graded Carbon NanotubeReinforced Composite,简称FG-CNTRC)具有轻质高强的优良特性,在航空航天、人员及结构防护等领域有广阔的应用前景,FG-CNTRC板结构的低速冲击响应也引起了相关研究人员的广泛关注。针对现有研究的不足,本文基于弱形式求积元法(Weak Form Quadrature Elem
学位
声表面波(surface acoustic wave,SAW)器件由于具有信号处理简单方便、很强的抗辐射功能、动态范围大、适于批量化生产等优点一直受到学者们的青睐,广泛应用于移动通信系统、电视、广播、各类军用雷达、传感器、滤波器中。压电材料和叉指电极是决定声表面波器件性能的关键要素。氮化铝压电薄膜具有高声速和温度稳定性好等显著优点,是与高声速衬底材料结合制备声表面波器件的理想材料;石墨烯可以维持巨
学位