基于深度学习的多变量时间序列分类方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:haidao_123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多变量时间序列(Multivariate Time Series)是在每一个时间步上都有多个变量值的时间序列。多变量时间序列分类作为多变量时序数据挖掘的重要分支,具有非常大的研究意义。当前多变量时间序列分类的方法主要包括基于特征驱动的方法和基于数据驱动的方法。虽然基于特征驱动的方法在许多领域取得了一定的成果,但是该方法会消耗大量的人力,而且容易受领域知识限制。基于数据驱动的方法以深度学习为主要技术,实现了数据特征自动挖掘,大大地提高了分类技术落地的可能性。由于多变量时序数据有不同于图像数据和文本数据的特性,借鉴使用在其他领域的深度学习技术存在一定限制。本文针对当前基于深度学习技术的多变量时间序列分类方法中仍然存在的问题和潜在的提升空间做了相关研究。研究内容自顶向下,不仅从理论上进行了可行性分析,而且在领域公开数据集上与现有的模型进行了对比实验,取得了一定的成果。针对现有模型仍然不能很好地捕捉多变量时序数据的时间依赖特征的问题,本文提出了一种基于自注意力机制的多变量时间序列分类方法。该方法使用的基准模型主要由时间卷积网络组成。自注意力机制在基准模型能够挖掘原始数据样本局部窗口中的变量相关性特征的基础上,加强了模型对数据样本全局任意时间点之间的相关性特征抽取能力。模型短小精悍,具有较强的鲁棒性和通用性。该方法能在一定程度上打破领域知识限制,为非专业人员入门研究提供一个简单有效的解决方案。针对现有的基于传感器数据的人类活动识别模型的网络结构过于单一的问题,本文发现了其潜在的提升空间并提出了一个融合多网络结构的多变量时间序列分类方法。该方法在原始模型使用卷积神经网络和循环神经网络的基础上,通过融合自注意力机制和胶囊网络结构对其进行了改进。改进措施使原始模型着重关注部分时间步上的特征,更加充分地利用隐藏层输出的重要信息并且提高了最终的分类性能。同时,改进后的模型与当下最佳的模型相比具有一定的竞争力。
其他文献
近年来国内致密砂岩油藏在水平井、体积压裂与“工厂化”作业等技术的支持下,得到了有效的开发利用,但对致密砂岩储层孔隙结构特征的研究和致密砂岩油藏水驱油效率影响因素的
在深部资源开采工程和地下空间拓展工程中,岩柱的稳定性问题一直是实际工程开展所面临的一项难题。由于深部岩体处于“三高一扰动”的特殊地质力学环境,天然或人造岩体发生失
随着人类长非编码RNA和疾病关系研究不断深入,出现了预测长非编码RNA-疾病关系的方法。引入被证实的长非编码RNA和疾病的关系组建关系网络,科研人员使用网络表示学习获得节点
图作为建模大规模网络的通用数据结构一直以来受到了学术界的广泛关注,比如交通网络、社交网络、生物网络、协作网络和通信网络等都可以抽象为图。由于数据采集和处理过程中
有机硅具有很多其他材料不可比拟的优良性能,广泛应用于工农业生产和国防等高科技领域。随着现代工业的快速发展和新一轮科技革命的到来,对高性能材料的需求更为迫切,具有良
山体滑坡一直是人类面临的重大自然灾害之一。离子型稀土矿因地质环境及采矿工艺的特殊性,矿山采场频繁发生滑坡灾害。为尽可能减少因矿山采场滑坡给企业及矿区周边人民造成
岩石变形破坏过程的实质是内部微裂纹的演化,声发射是岩石变形破坏过程的伴生现象,其活动特征与微破裂演化活动的机制最为接近。岩石破坏前常存在声发射相对平静期,且其产生
函数依赖是重要的元数据,用于描述数据集中列之间的关系,可以被用于很多任务中,例如范式结构标准化,数据清洗等。很多单机和并行函数依赖发现算法已经被提出。之前的单机算法
环境是人们赖以生存和社会经济可持续发展的客观条件和空间,随着近现代工业的快速发展,环境污染也日益加剧,而在环境污染中,大气污染又是环境污染中危害范围最广,影响程度最
近年来,虽然我国煤矿事故总量和百万吨死亡率逐年呈下降趋势,但与其他发达国家相比,差距仍然很大。根据我国学者对国内外重大事故调查研究,发现人的不安全行为是导致矿难事故