论文部分内容阅读
基于位置服务运行过程中积累了大量记录用户行为的语义时空数据,利用这些语义时空数据对人类移动性建模和预测在很多应用中具有重要价值。人类移动性建模问题可以分为个体移动预测和群体移动建模,个体移动预测是通过研究用户个体行为规律,预测未来的活动和位置,可以为兴趣点推荐、出行规划和精准广告等应用提供帮助,群体移动建模是在一定地理维度上建模人类群体的流动和集散,在交通管理和智慧城市等场景中有着重要作用。相比传统的时空数据,语义时空数据中包含用户的活动信息和地理位置的语义信息,为个体移动预测和群体移动建模带来了新的机遇,同时语义时空数据特有的稀疏性也为相关研究问题带来了新的挑战。在调研和分析了相关研究之后,我们在基于语义时空数据的个体和群体移动建模领域开展了若干研究工作。首先本文研究了如何利用语义时空数据中的活动信息来提升个体位置预测能力的问题。考虑到用户的活动目的影响位置选择,很多研究者将位置预测问题分成两个子问题,个体活动预测和给定活动目的的位置预测。然而现有研究提出的方法无法有效地整合个体行为的序列规律和时间特征,同时在建模给定活动目的下个体位置偏好时忽略了时间情景的影响。我们设计了一个两阶段个体移动预测方法,首先在第一阶段提出了情景感知模型堆叠方法,集成序列模型和时间特征模型来预测个体活动,然后在第二阶段为了应对语义数据的稀疏性,用贝叶斯方法预测个体在给定活动目的下的位置选择概率。基于公开的签到数据集,我们通过大量的实验验证了本章提出的两阶段方法优于现有位置预测方法。其次本文研究了如何建模个体活动和位置间的相互影响,并且利用这种相互影响来进一步提升个体活动和位置预测准确率。我们提出了个体“活动-位置主题”来刻画个体活动和位置偏好的内在联系,并基于此设计了多任务深度循环神经网络来建模“活动-位置主题”,同时预测个体活动和位置。为了应对语义数据稀疏带来的序列关系不稳定,并且整合个体行为的时间特征,我们设计了情景感知循环单元;为了利用位置的地理空间特征和活动类型特征,我们设计了基于图嵌人的表示学习方法来学习位置和活动的低维嵌入向量。通过大量实验,我们对比了该模型和现有工作的活动和位置预测能力,并且通过一个案例研究展示了“活动-位置”主题刻画个体活动和位置内在联系的合理性。最后本文研究了基于语义时空数据的兴趣点人流量建模问题。预测兴趣点人流量对兴趣点的访客和经营者都有重要意义,也能为基于位置服务提供搜索和推荐服务提供帮助。研究人员尝试使用非参数时序模型和参数化的机器学习模型来建模兴趣点人流量的时间规律。我们收集了8000个兴趣点的人流量数据,对这些数据分析发现兴趣点人流量除了呈现时间规律,还会出现意外波动情况。基于此我们提出一个常规-意外访客混合模型。在该模型中,采用非参数估计的方式来提取兴趣点访客的时间规律特征,设计了图卷积神经网络来预测区域人流量,并用区域-活动转移模式矩阵建模人群活动目的分布,然后将时间规律特征、区域人流量和活动目的分布整合在一起用回归模型预测兴趣点人流量。通过大量在Foursquare兴趣点人流量数据集上的实验验证,证明了我们提出方法的有效性和优越性。