论文部分内容阅读
近年来,随着移动互联网、物联网等新型技术的不断发展,已经产生了大量的时空轨迹数据,这些数据蕴含了移动物体的移动性。对轨迹数据中隐含的移动模式进行挖掘,可以发现新颖、有价值的信息和规律,提高它在公共交通、环境监测以及公共安全等领域的应用价值。轨迹数据具有时空属性和多源性,传统的机器学习方法难以全面考虑时空属性和轨迹其它特征。因此,如何快速、有效、自动且准确地从轨迹数据中挖掘出有用的信息,发现轨迹数据中隐含的移动模式,对轨迹研究至关重要。本文以移动对象的轨迹数据为研究对象,以深度学习为研究方法,以轨迹数据中移动模式的发现为研究目标,从轨迹聚类、轨迹分类以及交通流量预测三个角度来对移动模式进行发现和研究。研究内容如下所述:轨迹聚类将相似的轨迹聚到一个簇。现有的轨迹聚类方法通常是提取能够表示轨迹数据的移动行为特征,然后通过基于相似性度量的聚类方法来对轨迹进行聚类。但是,阻碍其广泛应用的一个障碍是有限的传感器设备、通信错误、传感器错误或者传感器空缺都会导致轨迹数据有噪声或者缺失。对此,本文提出鲁棒性深度注意力自编码器Robust DAA来解决轨迹聚类中轨迹数据的噪声问题,从而得到高质量的去噪的低维特征表示。具体来说,该模型将注意力机制引入传统的深度自编码器形成深度注意力自编码器,能够加强特征传播和特征选择。应用近端方法、反向传播以及交替方向乘子算法来训练深度注意力自编码器,使得Robust DAA能够进一步减轻轨迹数据中噪声的影响。最后,将得到的低维去噪的特征表示输入到传统的聚类算法中,得到聚类结果。本文在合成数据集以及真实数据集上进行了实验,实验结果表明本文的模型在正确率、精确率、召回率以及F1分数上优于目前的模型。关于轨迹分类的研究有很多,但是由于它们进行特征工程和发现分类规则的过程比较复杂,并且由于没有充分考虑时间和空间属性对于分类结果的影响,从而降低了分类效果,也就不适合本文的任务。为了解决以上问题,本文提出深度多尺度学习模型MslNet。该模型从不同的空间和时间维度建立模型,从而可以充分考虑到时间粒度和空间粒度对于轨迹分类的影响。最后将两部分模型的特征表示进行融合,输出最终的分类结果。本文设计的模型是基于目前先进的图像分类网络结构DenseNet,并且结合注意力机制的端到端模型,模型能够充分捕获局部特征和空间特征,进一步加强特征的传播,捕捉长期依赖,网络结构参数的数量也有所下降。本文在两个真实数据集(Geolife、宁波AIS数据)上对模型进行评估,结果表明本文的模型在正确率、精确率、召回率以及F1分数上优于目前先进的模型,并且分类结果对于理解移动性也有一定的准确性与实用性。对于交通流量预测的研究,本文主要是预测城市级别的区域与区域之间的交通流量。传统的时序预测模型仅仅只是关注时间属性,所以在预测精度上略有不足。现今最先进的流量预测模型,综合考虑了数据的时空属性以及其它影响流量的因素,但同时也使得模型变得复杂和模型的通用性不足,特别的是当其中的某些数据缺失时,预测精度会有严重下降。因此,本文提出一种长短期记忆网络LSTM和残差网络ResNet相结合的网络结构DSTRL-Net来预测区域之间的交通流量。对于轨迹数据独特的属性,设计了一种端到端的卷积神经网络,卷积结构用来挖掘和处理轨迹数据的空间属性,并且在卷积神经网络中加入了残差结构,用来优化网络结构;用LSTM来处理轨迹数据的时间属性,需要注意的是ResNet和LSTM分别用来发现要预测时刻前几个时刻的流量对于要预测时刻流量的空间和时间影响,模型更有通用性。最后对于处理时间属性和空间属性模型的结果,本文提出了一种基于门限机制的融合算法,输出区域之间的交通流量。对成都出租车和纽约自行车这两种交通流量以及宁波的船舶AIS流量数据的实验表明,本文提出的模型在精度和通用性上是优于目前最先进的方法的。