多变量时间序列分类方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lianghaiyanps3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的日益发展,在日常生产生活中产生了大量的多变量时间序列数据。由于多变量时间序列数据长度可变、变量维度高、变量耦合并且时间依赖长。因此,对多变量时间序列分类研究极具挑战性。近年来,为更好地表征多变量时间序列和寻求分类性能的突破,不断有学者提出新的方案来解决多变量时间序列分类中存在的各种挑战,并取得了骄人的成绩。然而,这些方法仍然不能很好地刻画多变量时间序列的内在特征,从而无法获得更好的分类性能。由于目前对多变量时间序列分类的研究工作还不是很多,对上述问题的研究仍处于探索阶段。针对上述问题,本文在前人研究基础上,针对在多变量时间序列分类中存在的各种问题进行展开全面而详细地探究。本文开展多变量时间序列分类探究具有重要的基础理论意义和科学探索价值。本文的主要研究工作为:(1)针对多变量时间序列可变长度、变量维数高和各变量关联性复杂等特性,提出一种基于KL散度的稀疏逆协方差多变量时间序列分类方法(KLD-SICT)。首先采用PCA对高维度变量进行降维处理,在满足剩余信息保留量下,极大减少了变量数。利用高斯图模型参数来表征多变量时间序列,解决序列长度可变性的问题。为能够发现和捕捉各变量间隐藏关联性,应用交替方向乘子法(ADMM)计算稀疏逆协方差矩阵,并能有效阻止模型过度拟合。最后,计算高斯图模型之间的KL散度,以此构造模型分类器对多变量时间序列数据进行分类。在多个数据集上的实验表明,KLDSICT显著优于基线方法,验证了KLD-SICT的有效性,且通过降维操作,显著降低了模型时间复杂度。(2)针对多变量时间序列数据变量耦合并且时间依赖长的问题,提出一种新颖的基于FCN和注意双向GRU的多变量时间序列分类方法(MFCN-BiGRU)。在空间维度上,通过多个卷积块获取各通道间的相互作用,并引入压缩和激励模块,突显关键特征通道。在时间维度上,利用双向GRU捕捉序列双向时间依赖,添加注意力机制来强调关键区域特征。最后,利用门控融合空间和时间维度特征,对多变量时间序列端到端分类。在多个数据集上的大量实验表明,MFCN-BiGRU显著优于基线方法,充分证明了MFCN-BiGRU的高效性。各模块的消融研究表明,通过各部分相互协作,显著提高模型整体性能。(3)针对多变量时间序列各变量间隐藏复杂依赖关系的表征和突出问题,提出一种新颖的基于时空图卷积网络的多变量时间序列分类方法(MSTGCN)。MSTGCN利用图结构来表征变量间隐藏的相关性,通过自适应图结构学习方式来显式对变量间的相关性进行建模。利用时空图卷积综合提取多变量时间序列数据的全局时空特征信息。使用时空注意力机制从原始多变量时间序列数据中自动提取每个通道具有重要价值的时空信息。在多个数据集上与各种基线方法结果对比表明,利用图结构对变量间相关性进行建模的有效性。通过消融研究表明,MSTGCN自适图结构学习方法能有效学习变量间复杂的依赖关系,验证了该方法的有效性。
其他文献
随着科学技术的发展,特别是人工智能技术的兴起,任务型多轮对话系统逐渐成为学术界和工业界的研究热点。任务型多轮对话系统针对具体任务场景进行设计,通过与用户之间进行对话交互,收集所需信息,帮助用户完成特定任务。目前,任务型多轮对话系统主要有基于管道和基于端到端两种构建方式。基于端到端的方法由于存在对数据需求量较大、可解释性差和对话流程难以控制等问题。因此目前主流的做法是通过管道的方式构建任务型多轮对话
学位
为了尽可能的减少执法安全事故,提升公安机关的执法形象与执法公信力,以及执法办案效率,大力的推进公安大数据智能化建设成为了行业发展的迫切需要。依托于此需求,近年来,执法办案中心的人员定位管理系统逐步发展,智能手环的应用也趋于成熟,但始终摆脱不了嫌疑人员的行为无法记录,执法办案流程以及执法行为无法监管等行业痛点,且智能手环自身也存在成本过高、续航不理想、个人信息易泄露等缺点,如何在减少甚至不使用智能手
学位
随着信息技术和互联网的发展,数据库管理系统作为基础平台软件,在信息系统中扮演日益关键的角色。目前,国内多个核心行业仍大量使用国外的数据库产品,存在重大的安全隐患。因此,在国际形势日趋复杂的今天,发展国产数据库,让更多应用运行在国产数据库产品之上已是当务之急。数据迁移是数据库国产化的重要举措,然而现有的数据迁移项目大多采用直接迁移的方法,未全面了解源数据库并根据迁移数据库间的差异完成迁移,这导致数据
学位
现代电力系统中部署了大量的智能硬件设备,如智能电表等。智能设备在提供更多先进技术的同时,也给电力系统带来了很多漏洞,导致恶意窃电用户可以随时随地发动各种网络/物理攻击来窃取电力。窃电不仅给公共事业公司带来了巨大的经济损失,还可能引发火灾等事故,危害公共安全。所以,智能电网邻域网中窃电行为检测的研究目的就是及时发现邻域网中的窃电行为,并识别出所有的窃电用户。窃电用户识别的主要难点和挑战在于:如何设计
学位
近些年来,随着区块链的技术越来越成熟、去中心化的思想被越来越多的人认可,出现了各种各样新且广为人知的场景,如:非同质化代币等等。未来区块链不仅仅只是一个去中心化的加密货币的载体,它也变成越来越多应用的载体。未来区块链承载的价值会越来越大,相应而来的,区块链上需要存储更多的数据来支撑它的价值。但是现有的区块链方案大多数都是针对于小型数据以及大型数据上链的解决方案。随着区块链在非交易场景以及其他场景中
学位
区块链是在加密虚拟货币的应用基础之上兴起的一种分布式数据共享技术,在智慧城市、税务审计、金融科技等领域具有广阔的应用前景,为生产生活提供了弱中心化、高透明度、强公信力的统一数据平台。随着区块链应用场景的不断丰富,区块链的数据规模不断膨胀、检索需求持续增加且趋于复杂化。然而,现有的区块链平台往往只考虑单一的应用场景,采用粗粒度数据组织方式,普遍存在数据可用性差、可搜索性差、检索效率低等问题,已较难对
学位
区块链技术作为推动信息互联网向价值互联网转变的核心技术,广泛应用于金融、供应链和电子政务等重点行业。垂直行业信息融合与价值传递是充分激活区块链内生价值属性和潜力的重要一环。目前,区块链呈现布局碎片化、数据隔离化特征,难以实现垂直行业信息融合需求,使得信息价值阻塞,造成数据孤岛问题严重。然而,各行业区块链系统呈现差异化需求、定制化设计和异构化平台等特征,使得跨链数据交互与价值传递难以实现。现有区块链
学位
知识图谱是一种采用图结构化的方式存储现实世界中代表事物的实体以及实体之间的关系,为海量的非结构化互联网信息数据提供了一种行之有效的处理方式。以知识图谱作为数据来源的问答技术成为当今AI领域的热门研究方向,但目前基于知识图谱的智能问答技术在简单问题上的问答效果较好,却难以应对包含多个关系的复杂问题,缺乏复杂问题在知识图谱上的推理能力,大大降低了实际问答效果。本文对基于知识图谱的多跳推理问答技术进行研
学位
随着数据的爆发式增长以及计算机硬件的快速发展,基于数据驱动的深度学习技术得到了迅速发展,近年来已经在机器学习领域占据主导地位。深度学习被广泛应用于各个领域,如自动驾驶、机器翻译、目标检测、医疗诊断等,并且取得了巨大的成功。但模型的训练需要大量的数据资源和计算资源,因而用户往往会将训练过程外包给第三方,或者从不完全可信的服务提供商处获得预训练模型。由于深度学习模型缺乏可解释性,深度学习模型在其生命周
学位
随着机器学习技术应用快速发展,“机器学习即服务”这个概念应运而生。在该模式中,服务方拥有大规模数据以及专家级的训练算法,进而可以得到高质量模型为用户提供可靠的数据推理预测服务。已有的研究主要专注于“机器学习即服务”过程中的隐私问题,实现对数据模型生成、用户数据、推理结果以及推理过程的机密性保护。然而,在“机器学习即服务”的过程中,出于某些特定的原因,恶意服务提供商可能提供一个低质量的模型,导致用户
学位