基于深度学习的轨迹数据中移动模式发现方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:liujun87654
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动互联网、物联网等新型技术的不断发展,已经产生了大量的时空轨迹数据,这些数据蕴含了移动物体的移动性。对轨迹数据中隐含的移动模式进行挖掘,可以发现新颖、有价值的信息和规律,提高它在公共交通、环境监测以及公共安全等领域的应用价值。轨迹数据具有时空属性和多源性,传统的机器学习方法难以全面考虑时空属性和轨迹其它特征。因此,如何快速、有效、自动且准确地从轨迹数据中挖掘出有用的信息,发现轨迹数据中隐含的移动模式,对轨迹研究至关重要。本文以移动对象的轨迹数据为研究对象,以深度学习为研究方法,以轨迹数据中移动模式的发现为研究目标,从轨迹聚类、轨迹分类以及交通流量预测三个角度来对移动模式进行发现和研究。研究内容如下所述:轨迹聚类将相似的轨迹聚到一个簇。现有的轨迹聚类方法通常是提取能够表示轨迹数据的移动行为特征,然后通过基于相似性度量的聚类方法来对轨迹进行聚类。但是,阻碍其广泛应用的一个障碍是有限的传感器设备、通信错误、传感器错误或者传感器空缺都会导致轨迹数据有噪声或者缺失。对此,本文提出鲁棒性深度注意力自编码器Robust DAA来解决轨迹聚类中轨迹数据的噪声问题,从而得到高质量的去噪的低维特征表示。具体来说,该模型将注意力机制引入传统的深度自编码器形成深度注意力自编码器,能够加强特征传播和特征选择。应用近端方法、反向传播以及交替方向乘子算法来训练深度注意力自编码器,使得Robust DAA能够进一步减轻轨迹数据中噪声的影响。最后,将得到的低维去噪的特征表示输入到传统的聚类算法中,得到聚类结果。本文在合成数据集以及真实数据集上进行了实验,实验结果表明本文的模型在正确率、精确率、召回率以及F1分数上优于目前的模型。关于轨迹分类的研究有很多,但是由于它们进行特征工程和发现分类规则的过程比较复杂,并且由于没有充分考虑时间和空间属性对于分类结果的影响,从而降低了分类效果,也就不适合本文的任务。为了解决以上问题,本文提出深度多尺度学习模型MslNet。该模型从不同的空间和时间维度建立模型,从而可以充分考虑到时间粒度和空间粒度对于轨迹分类的影响。最后将两部分模型的特征表示进行融合,输出最终的分类结果。本文设计的模型是基于目前先进的图像分类网络结构DenseNet,并且结合注意力机制的端到端模型,模型能够充分捕获局部特征和空间特征,进一步加强特征的传播,捕捉长期依赖,网络结构参数的数量也有所下降。本文在两个真实数据集(Geolife、宁波AIS数据)上对模型进行评估,结果表明本文的模型在正确率、精确率、召回率以及F1分数上优于目前先进的模型,并且分类结果对于理解移动性也有一定的准确性与实用性。对于交通流量预测的研究,本文主要是预测城市级别的区域与区域之间的交通流量。传统的时序预测模型仅仅只是关注时间属性,所以在预测精度上略有不足。现今最先进的流量预测模型,综合考虑了数据的时空属性以及其它影响流量的因素,但同时也使得模型变得复杂和模型的通用性不足,特别的是当其中的某些数据缺失时,预测精度会有严重下降。因此,本文提出一种长短期记忆网络LSTM和残差网络ResNet相结合的网络结构DSTRL-Net来预测区域之间的交通流量。对于轨迹数据独特的属性,设计了一种端到端的卷积神经网络,卷积结构用来挖掘和处理轨迹数据的空间属性,并且在卷积神经网络中加入了残差结构,用来优化网络结构;用LSTM来处理轨迹数据的时间属性,需要注意的是ResNet和LSTM分别用来发现要预测时刻前几个时刻的流量对于要预测时刻流量的空间和时间影响,模型更有通用性。最后对于处理时间属性和空间属性模型的结果,本文提出了一种基于门限机制的融合算法,输出区域之间的交通流量。对成都出租车和纽约自行车这两种交通流量以及宁波的船舶AIS流量数据的实验表明,本文提出的模型在精度和通用性上是优于目前最先进的方法的。
其他文献
随着信息技术的更新发展,人们步入了大数据时代。人们日常生活中随时随地都在产生大量的信息数据,如何在海量的信息中获得隐藏在其中的有价值的信息,成为一个新的研究热点。其中聚类分析就是一种很常见的数据挖掘方法。与一般的单个聚类算法不同,聚类集成通过设计一个共识函数将多个不同的聚类结果融合,能获得比单个聚类算法更好的聚类结果,但要是在集成成员生成过程中产生的聚类成员结构不同,怎样选择合适的聚类成员,将对最
如今我国的交通安全问题已上升为一个社会问题,随着中国车辆的逐渐增多,道路交通事故也发生得越发频繁。在中国,因道路交通安全事故伤亡人数一直在逐年递增,那到底是什么原因导致这样的呢?调查发现人们对交通规则的漠视可能是造成交通事故的主要因素之一,而利用公益广告宣传道路交通安全意识,是减少道路交通安全事故的重要手段。但广告投入之后,效果却并没有想象中的那么好。因此探究公益广告怎样才有更好的引导作用是非常重
随着计算机软硬件的更新换代,现如今的计算机能够获取到的图像资源正在呈几何式的增长。当海量的图像资源涌入我们的视野,为了获取图像中的关键信息,计算机必须要对这些图像作相应的处理从而让图像中的关键信息展露无遗。而传统的图像处理方法较低的准确率与过高的执行时间显然无法应付当今的海量图像资源。这无疑给图像处理领域带来了新的难题,同时也提出了新的挑战。而图像分割作为计算机视觉领域的基础,首当其冲。传统的图像
现今社会,信息化技术正处于高速发展的状态,在各行业得到了广泛应用。其中,挖掘新闻评论短文本中蕴含的有效情感信息,从而达到对社会舆情进行管控等目的,成为近年来的研究热
VS2是重要的析氢反应(HER)催化剂,其催化活性代表了当前过渡金属硫化物(TMDs)的最佳水平,有望替代贵金属Pt成为高效而廉价的催化剂。然而,以往基于氢吸附模型的计算忽略了水环境
本研究基于注意评价模型探索述情障碍亚类型个体进行情绪标注时的行为及脑电的特点。情绪标注指个体使用词汇来描述刺激和事件的情绪方面特征,是一种情绪调节的手段;述情障碍是以识别、描述情绪困难,外向性思维为核心特征的一类特殊个体。一方面述情障碍在概念上与情绪标注对情绪刺激的识别和命名的特点相重合;另一方面述情障碍与很多疾病的共患率高,而目前以特殊个体为被试的情绪标注研究结果并不一致,是何种因素在其中起作用
本文研究了社会流动对经济增长的影响路径和效果,并提出了三个假设。其一,社会流动分为主观和客观两方面,即社会流动水平和社会流动感知。由于经济个体的认知能力有限,致使在许多情况下,个人的社会流动感知与社会流动存在着差异。客观社会流动和主观社会流动感知的差异,形成了经济制度对个体激励的不确定性,继而会带来个体人力资本投资和劳动时间投入的变化,继而影响经济增长。其二,文章从理论上证明经济的持续增长来源于人
现代信息社会的身份认证系统已经逐渐趋向于基于生物特征的身份认证。其中的人脸特征由于具有不易伪造和不被遗忘的特性,而被广泛用于身份识别。人脸模板保护技术的目标是结
随着人们环保意识的增强,城市建设项目和交通工具等带来的噪声引发许多矛盾。噪声地图是体现噪声分布情况的工具,被运用于噪声污染防治等领域。然而由于传统的绘制噪声地图方式存在采集设备成本高、覆盖率低、地图更新不及时等问题,严重影响了噪声地图的推广与应用。伴随移动网络技术的不断发展,移动智能终端普及率越来越高。在此背景下,使用智能终端替代传统测量设备,结合大数据技术,开发一款实时监测环境噪声及动态展示噪声
随着深度学习时代的来临,计算机视觉在许多语义理解任务上都取得了很好的成绩,包括分类、检测、分割。将破碎的文档数据进行拼接,并恢复出原状是一个十分困难的问题。它涉及到计算机视觉和人工智能算法当中的匹配、识别、大规模状态空间当中的搜索等问题。研究文档拼接问题过程中涉及的上述这些技术除了其本身对计算机视觉和人工智能算法相关问题有重要的意义之外,解决文档问题在考古、刑侦领域也有广泛的应用。本文注意到了文档