论文部分内容阅读
近年来,随着时空数据的广泛应用,各种面向时空数据的分析也相继而出,并逐渐成为具有理论与应用价值的研究热点。时空数据的类型多种多样,其中包括位置轨迹数据(包括交通轨迹数据,物流轨迹数据,GPS数据等等),遥感大数据(包括卫星遥感数据,工业控制系统传感器数据等等),以及与空间位置相关联的媒体数据(指具有空间位置特征并且随时间变化的数字化文本、图像、声音、视频等媒体数据,比如通信数据、城市监控视频数据、社交网络数据等等)。时空数据一般由多个时间序列组成,每个时间序列本身具有时间上的依赖关系,而这些序列之间又具有空间上的一定关联。时空数据预测就是通过整合已知的多种数据信息来预测该时空数据未来的变化,其已经逐渐成为时空数据分析中的重要研究方向。在时空数据预测任务中,如何有效学习数据中的时空关联性是一个重要挑战,但是大多数方法重点关注时空数据的时间特征或空间特征,如何分析时空特征的关联并实现准确预测仍存在困难,因此本文利用图卷积网络GCN来有效的处理不规则的空间结构,并利用长短期神经网络LSTM来学习时空数据中的时间依赖。此外,传统时空预测模型的流程往往由多个独立的模块组成,但是每个模块之间的协同合作的代价一般是昂贵的,因此本文通过结合GCN和LSTM的特点提出了一个端到端的时空预测模型GCLSTM,可以有效的训练整个模型。其次,由于时空数据的输入序列一般比较长,现有模型难以学到合理的向量表示,模型的性能会变差。针对这个问题,本文利用两种注意力机制分别在时间以及空间上关注更多与预测任务息息相关的输入特征,并提出了一种基于时空注意力机制的深度模型GLAT。最后将两种时空模型分别结合Seq2Seq模型并应用于交通领域,研究并提出两种基于时空相关性的交通速度预测方法,具有一定的应用意义。具体研究内容包括以下几个部分:(1)针对动态网络的网络结构不规则的问题,本文提出利用图卷积网络GCN来有效的处理这些不规则的空间结构,并利用长短期神经网络LSTM来学习动态网络中的时间依赖,并结合两种的优点提出了一种新的端到端的深度模型GCLSTM,可以实现整体网络的链路预测。每个LSTM单元后面跟着一个GCN单元,每个时刻利用不同的结构关系作为附加信息,进一步更新时间特征,并逐层传输信息,预测模型中包含更多的特征信息,性能也会更好。(2)当输入序列比较长时,模型难以学到合理的向量表示,导致模型的性能会变得很差。针对以上问题,本文提出了一种能够处理长输入数据序列的基于时空注意力的深度模型GLAT,利用空间注意力机制学习每个时刻隐藏状态和细胞状态的空间相关性,并通过时间注意力模型学习网络节点连边状态的时序信息,将注意力集中在所学习的时空特征中与任务最相关的部分,从而提高动态链路预测性能。(3)交通速度预测的应用验证。由于现实世界中交通网络是大量纵横交错的道路组成,其中每个特定路段的交通都有可能受到其邻近路段的影响。但是,传统的交通预测模型Seq2Seq模型旨在学习道路交叉点内的时间依赖性,而不是空间依赖性,因此忽略了邻近路段的影响。本文利用GCLSTM模型和GLAT模型结合Seq2Seq模型,同时集成交通网络的结构信息以及每条道路的交通速度的时序信息,有助于整个交通网络的速度预测。