论文部分内容阅读
出租车上的GPS设备记录了大量的交通轨迹数据,蕴含了时空环境下人们的移动模式与规律,覆盖范围广,可以有效反映城市的交通状况、人群流向等信息。但是轨迹数据往往规模大,复杂度高,维度多,而且存在采样率低、误差范围大等问题。如何有效分析海量的复杂交通数据,并从中挖掘出隐藏的有效信息加以利用,是很有挑战但却非常有意义的研究问题。本文尝试结合先进的数据挖掘与可视化技术对GPS轨迹数据进行分析与研究,探索分析城市交通的运行模式和规律。面向潜在商户的选址需求,本文通过对交通数据的分析与交互可视化,辅助潜在经商用户选择具有良好特性的区域经营店铺。论文的主要工作如下:(1)主题模型的建立与应用:本文基于GPS出租车轨迹数据构造了潜在狄利克雷分配模型(Latent Dirichlet Allocation,LDA)主题模型,将主题信息与交通数据中的交通访问量属性信息相结合,选出具有代表性的候选区域。(2)基于语义分析的交通流可视化:生成候选区域间的交通流图,帮助用户掌握区域分布的同时理解出租车的运行规律。分别从时间、空间、兴趣点三个角度研究模型中主题的分布规律与语义,帮助用户结合主题语义对城市中各个区域特征有深层次的理解。此外,允许用户探索交通流中轨迹与各个主题的相关度,了解轨迹的类型与模式。(3)面向用户探索的候选区域属性可视化:从轨迹数据中提取能够衡量交通状况的属性信息,设计隐喻的车轮图标来展示候选区域的多维属性,用户可以通过交互探索感兴趣区域的属性时间分布,多角度了解区域的细节特征。(4)交通轨迹数据分析与可视化原型系统:定位服务于待选址商家,为了方便用户对轨迹数据分析与研究,快速地选出满足自身需求的店址区域,本文设计并实现了面向交通轨迹数据分析与可视化原型系统,提供了从LDA主题与区域属性出发的多个可视分析界面以及多种交互操作。最后通过案例来分析验证系统的可用性与有效性。