论文部分内容阅读
关联时间序列广泛存在于各种生产生活场景中,如不同区域的交通客运需求时间序列、多个监测站的空气污染物浓度时间序列等,都是典型的关联时间序列。关联时间序列的有效预测具有重要的研究意义和应用价值。例如,若能准确预测交通领域的客运需求,将为提前感知市场动态、预分配交通资源、改善用户出行体验等带来极大的帮助;若能有效预测空气污染物浓度,将有助于人们提前采取防范措施,预防疾病的发生。然而,准确地预测关联时间序列具有很大的挑战。由于关联时间序列具有很复杂的内在特征,不仅序列内部存在时间依赖关系,序列之间还存在空间依赖关系。有效建模关联时间序列的时空依赖关系是关联时间序列预测任务的基础。但是传统的时间序列预测方法大多从单条序列的角度出发,难以有效建模关联时间序列的空间相关性。因此,本文将互相影响的关联时间序列看作一个整体,统一分析和建模关联时间序列的内在时空特征。本文的主要研究内容与创新点总结如下:首先分析了关联时间序列的内在特征,发现序列自身时间依赖特性和序列之间的空间依赖特性在关联时间序列建模任务中同时发挥着重要的作用。基于LSTM模型在时间序列的时间维度上建模的优势,本文提出了一种通用的基于LSTM的关联时间序列相关性建模方法(双通道LSTM)。双通道LSTM改变了传统LSTM的内部结构,采用两个通道显式建模时空依赖特征,并且使用先验关系矩阵描述序列之间的相互影响关系。本文同时在空气质量数据集和交通数据集上验证了双通道LSTM方法在关联时间序列相关性建模问题上的通用性和有效性。交通领域中很多场景下都存在关联时间序列预测的需求,对接交通领域具体应用需求,本文提出了交通领域的关联时间序列预测模型(CTS-LSTM)。紧密结合交通业务场景,CTS-LSTM基于双通道LSTM模型,自适应地学习交通领域的空间依赖关系,并有效融合交通序列的时间和空间两种相关性,以更好地建模交通序列的内在特征;此外设计了一种适用于交通领域的外部因素建模模块,用于捕获外部信息对于交通序列的影响。最终的预测结果由交通序列的内在特征和外部因素共同决定。在两个实际的交通数据预测业务场景下的实验结果表明,本文提出的CTS-LSTM可以综合建模交通数据的复杂时空模式和外部影响因素,其预测效果显著优于现有方法。