论文部分内容阅读
多变量时间序列(Multivariate Time Series)是在每一个时间步上都有多个变量值的时间序列。多变量时间序列分类作为多变量时序数据挖掘的重要分支,具有非常大的研究意义。当前多变量时间序列分类的方法主要包括基于特征驱动的方法和基于数据驱动的方法。虽然基于特征驱动的方法在许多领域取得了一定的成果,但是该方法会消耗大量的人力,而且容易受领域知识限制。基于数据驱动的方法以深度学习为主要技术,实现了数据特征自动挖掘,大大地提高了分类技术落地的可能性。由于多变量时序数据有不同于图像数据和文本数据的特性,借鉴使用在其他领域的深度学习技术存在一定限制。本文针对当前基于深度学习技术的多变量时间序列分类方法中仍然存在的问题和潜在的提升空间做了相关研究。研究内容自顶向下,不仅从理论上进行了可行性分析,而且在领域公开数据集上与现有的模型进行了对比实验,取得了一定的成果。针对现有模型仍然不能很好地捕捉多变量时序数据的时间依赖特征的问题,本文提出了一种基于自注意力机制的多变量时间序列分类方法。该方法使用的基准模型主要由时间卷积网络组成。自注意力机制在基准模型能够挖掘原始数据样本局部窗口中的变量相关性特征的基础上,加强了模型对数据样本全局任意时间点之间的相关性特征抽取能力。模型短小精悍,具有较强的鲁棒性和通用性。该方法能在一定程度上打破领域知识限制,为非专业人员入门研究提供一个简单有效的解决方案。针对现有的基于传感器数据的人类活动识别模型的网络结构过于单一的问题,本文发现了其潜在的提升空间并提出了一个融合多网络结构的多变量时间序列分类方法。该方法在原始模型使用卷积神经网络和循环神经网络的基础上,通过融合自注意力机制和胶囊网络结构对其进行了改进。改进措施使原始模型着重关注部分时间步上的特征,更加充分地利用隐藏层输出的重要信息并且提高了最终的分类性能。同时,改进后的模型与当下最佳的模型相比具有一定的竞争力。