论文部分内容阅读
定位技术与位置社交网络高速发展的背景下,轨迹数据呈爆炸式增长。轨迹数据包含移动对象的时空特征和移动行为信息,挖掘海量轨迹数据背后所蕴藏的丰富信息,既有理论研究价值也是紧迫的现实需求。轨迹数据挖掘是城市计算、智慧城市等未来城市服务的主要研究方向,广泛应用于交通疏导、城市应急服务响应、位置预测与推荐、群体移动感知、社交行为分析等领域。然而,轨迹数据挖掘在实际应用场景中仍面临一些问题。首先,由于轨迹数据语义缺失,人们无法理解轨迹数据中隐含的语义特征;其次,轨迹点序列式的表征方式无法适应于广泛的数据挖掘模型;再次,现有的位置预测模型的预测精度较低无法满足实际应用的需求。为此,论文围绕轨迹语义推断、轨迹表征学习、位置预测性能提升三个关键技术开展研究工作。论文的主要研究内容和研究成果如下:(1)针对轨迹语义缺失的问题,论文提出一种基于图卷积神经网络的位置语义推断模型(SI-GCN)。与现有手工提取位置特征或运动模式的方法不同,SI-GCN利用网络表征学习算法和变分自编码器分别学习位置的空间向量表征和时间向量表征,构成位置的时空特征。同时SI-GCN构造用户-位置访问二部图,采用图卷积神经网络学习用户签到活动中的高阶信息。此外,SI-GCN引入自注意力机制,区分用户-位置访问二部图中邻居节点的不同影响。SI-GCN在两个真实用户签到数据集上的实验结果表明,SI-GCN的语义推断性能优于现有方法。(2)针对轨迹表征困难的问题,论文提出融合时空结构的轨迹数据表征学习算法(STAR)。传统轨迹点序列表征方式割裂轨迹数据的时空耦合关系,且不适应于广泛的数据挖掘模型。STAR建立统一框架学习轨迹中的空间和时间信息,利用词向量表征学习算法学习轨迹空间信息,并丰富位置的上下文信息,包含地理上下文、轨迹上下文、语义上下文,利用自适应霍克斯过程建模用户出行时间信息。STAR利用轨迹向量表征作为桥梁连接空间表征与时间表征,通过轨迹向量表征和自适应霍克斯过程预测下一个访问位置和时间的过程,自动学习轨迹向量表征。相比于现有轨迹表征方式,STAR融合轨迹数据中的空间与时间信息,输出轨迹在特征空间的表征向量。STAR在相似性检索、相似度度量、异常检测等数据挖掘任务优于现有方法。(3)针对个人出行数据随机性高、数据稀疏,导致现有位置预测模型精度较低的问题,论文提出基于偏好社交互动的位置预测算法(PSI)。PSI通过引入群组出行模式,利用群组层面的出行模式缓解个人出行随机性对预测模型的影响。为了刻画群组层面的出行模式,算法通过度量用户轨迹相似度构建用户群组,利用关联规则挖掘算法提取群组出行模式,然后建立个人偏好模型。通过岭回归学习个人偏好与群组出行模式对位置预测的贡献,预测用户出行位置。与现有方法相比,引入群组级别出行模式的PSI,提高偏好社交互动模型的鲁棒性,减轻数据稀疏性对模型的影响,位置预测性能优于现有预测算法。(4)针对用户签到行为的成因与动态机制缺乏深入研究的问题,论文提出地理感知的用户行为动态模型(DGPS)。DGPS同时考虑地理感知的用户偏好和由社交关系引起的社交互动激励驱动用户签到行为,学习用户签到行为的动态机制。其中,建立地理感知的位置特征(包括语义特征、潜在特征和动态特征)用于表征位置信息并揭示位置的地理影响的演化,利用地理感知位置特征,模型学习用户个人偏好。DGPS利用时间点过程建模用户签到行为学习用户行为的动态机制,将地理感知的用户偏好和社交激励嵌入用户行为的强度函数中分析签到行为成因。通过研究用户签到行为成因与动态机制,DGPS能够同时预测用户签到活动的位置与时间。多个真实数据集上的实验结果表明DGPS预测性能优于现有方法。