论文部分内容阅读
目前,智能移动设备通常都带有利用了全球定位技术的位置传感器,可以准确的捕捉到移动设备的具体位置信息。随着位置获取和移动计算方面的技术的进步,产生了大量的数据,这些数据代表了各种不同种类的移动的物体如人,动物,车辆等的轨迹记录。并且这些位置信息可以通过众包的方式利用无线传输技术上传到服务器当中,形成大量的GPS轨迹数据。GPS轨迹大数据中包含了史无前例的信息,可以让我们更好的理解移动对象和地理位置,伴随产生了大量的基于位置的社交网络、智能交通系统和城市计算等应用。这些应用的流行,反过来又不断的促进新的系统性的轨迹大数据挖掘的研究。在这个良性的发展循环当中,GPS轨迹大数据的挖掘成为了一个热点的研究问题,吸引着包括计算机领域、社会学领域和地理信息领域的学者对此不懈研究。但是单纯从轨迹数据中挖掘人类活动语义信息是困难的。从更抽象的层次看,轨迹数据只是时空数据的一种,时空数据是带有空间坐标和时间戳的数据,具有时间属性和空间属性。能够准确预测时空数据变化情况对于地理位置推荐等城市计算相关应用具有重要意义。另一方面,城市中的兴趣点(Point of Interests,POI)等静态的地理空间信息也会对人类活动产生重要甚至是根本性的影响,因为人类是生活在一定地理环境中的,POI往往成为人类日常社会活动的参与场所。本文试图融合使用轨迹时空数据和地理静态信息两种数据,在复杂的城市环境中预测出不同区域的停留点数量变化情况。停留点也是一种时空数据,指出租车低速巡游或静止等待乘客的地点。停留点预测对于出租车载客,乘客乘车,地理位置的热度变化,乃至交通疏导,城市安全,城市建设规划等方面都具有重要参考作用。对停留点的预测往往是地理位置推荐系统中的一部分,但是现有的热点区域推荐或出租车载客点推荐等研究中往往在这些方面有所欠缺,一是使用数据源不够丰富,导致推荐准确率不够高,二是直接对于历史轨迹数据进行挖掘分析,计算复杂度高,难以拓展到更大地理范围,而且实时性难以保证。本文融合了交通轨迹数据和基于微博签到的POI数据,提出了自己的预测框架,框架首先根据基于POI的空间相似性找到相似区域,并根据相似区域预测出下个时间段目标区域的停留点变化情况。本文还基于Apache Storm构建了一个实时处理系统,模拟了整个实时分析与预测过程。实验结果表明,预测的地点的情况与实际情况相比具有较高的准确率,并且整个流处理系统也具有实时处理大数据的低延迟,高吞吐量的特性。