论文部分内容阅读
随着我国经济的快速增长以及城市规模的不断扩大,人民生活水平逐渐提高。城市机动车的数量也在逐年增加。这样的快速增长在给人们的工作生活带来便捷的同时,也给城市交通带来了诸多难题。居民出行调查是城市交通规划调查的重要组成部分,同时也是获取居民的活动-出行行为规律的重要手段。以往的居民出行调查多采用纸质调查的方式,调查结果受志愿者对调查问题主观认知的影响较大,数据精度较低。此外,由于调查项目较多,受访者需耗费大量时间和精力填写调查报告,致使拒访率较高,回答准确度下降。随着定位技术的快速发展,基于智能手机的GPS数据调查方法为分析居民出行行为提供了新的数据获取手段和数据处理途径。论文内容主要包括以下三个部分:(1)介绍以智能手机和GPS网络为基础的居民出行调查方法。(2)基于GPS数据的出行方式识别。通过R语言编程对已收集到的上百万条居民出行GPS数据进行处理,并提取出行时间、出行距离、速度相关特征和加速度相关特征等作为推断出行方式的特征指标;然后,使用BP神经网络算法对步行、自行车、小汽车等6种出行方式进行识别,得到90.2%的整体识别精度和85.3%的平均识别精度;最后,用识别精度进行算法比较,验证BP神经网络算法对出行方式识别具有较高的准确性。(3)基于居民社会和出行信息的出行目的识别。结合已收集到的GPS数据信息,在“地图无忧”软件上观察判断出行端点的土地利用类型,并选取土地利用信息、出行方式选择和志愿者相关信息等作为推断出行目的的特征指标;由于特征指标过多,使用Boruta算法对特征变量进行筛选,并采用随机森林算法对上班、回家、上学、通学和休闲娱乐5种出行目的进行识别,得到88.5%的整体识别精度和85.8%的平均识别精度;最后,用识别精度进行算法比较,验证随机森林算法对出行目的识别具有较高的准确性。论文的创新点主要体现在以下几个方面:(1)更全面地选取用于识别出行方式的特征指标。通过对之前的出行方式识别方法的研究和总结,本文在已有数据的基础上,选取10种用于识别出行方式的特征指标,且每个特征指标对于出行方式的识别都有明确的区分性,为提高模型的识别精度提供了可能性。(2)使用Boruta算法对特征变量进行选择。合理的特征选择能够提高模型识别精度。本文运用Boruta算法,从表示出行目的的28个指标中筛选出最有效的15个特征变量,用于前人研究相对较少的出行目的识别过程。