论文部分内容阅读
随着当前智能手机、智能手表、智能行车记录仪等移动通讯设备的普及,通信运营商积累了海量的移动位置数据资源,能够为“智慧交通”建设提供详实有力的数据支撑。考虑到实际人员出行时间、次数随机,出行方式多样,存在换乘、往返等复杂情况,在根据移动位置数据研究城市居民出行特征时,首先需要识别用户轨迹中的驻留点;然后根据驻留点将轨迹划分成模式单一的出行链;最后逐段将出行定位轨迹匹配到对应行驶路段上,完成地图匹配。为识别用户轨迹中的驻留点,本文首先对运营商提供的志愿者数据进行预处理,识别并消除轨迹震荡现象,得到准确的位置信息;然后在密度峰值快速聚类(Clustering by Fast Search and Find of Density Peaks,CFSFDP)算法的基础上显式地增加对时间维度限制,将局部密度由二维扩展到三维,同时提出高密度时间间隔的概念,引入聚类中心权值,制定筛选策略以自动地选取聚类中心;最后识别出一段时间内用户出行轨迹中的驻留点,完成出行链的划分。实验结果表明,所提算法适用于采样密度低且定位精度较差的移动位置数据,相比CFSFDP算法更加适用于时空数据,相比基于密度的时空聚类算法召回率提升14%,准确率提升8%,同时也避免了多次迭代过程,降低了计算复杂度。为了将出行定位轨迹匹配到对应路段上,本文基于隐马尔可夫模型(Hidden Markov Model,HMM)完成地图匹配,首先建立基站与路网信息数据库,并通过插值法对稀疏定位轨迹进行填充;在此基础上考虑到城市路网的复杂性与匹配计算成本,根据冯洛诺伊图制定候选路段搜索区域,缩小隐状态空间大小;考虑观测定位点与候选路段的距离、候选路段在搜索区域内的长度、匹配前后轨迹相似性、当前道路与候选道路之间的连通性以及道路中存在的单向行驶的行车限制,建立HMM模型;最后将地图匹配问题转换为HMM中的预测问题,并利用维特比算法求解,得到实际出行对应的路网轨迹。本文通过移动位置数据研究居民的出行行为,为以移动数据为代表的低精度位置数据的应用研究提供了新的思路,并且为基于移动位置数据展开的出行方式和出行目的识别等具体应用奠定了重要基础。