论文部分内容阅读
进行居民出行调查、分析居民出行特征和掌握居民出行规律是科学规划和有效管理交通系统的重要环节。通过传统的问卷调查法来获取居民出行数据极易受到调查对象主观意识的影响,而通过GPS中记录的地理位置及时间信息来获取居民出行数据的方法能够避免该不足,为交通建模以及交通运行监控平台的搭建提供了全面可靠的数据支撑。因此利用GPS设备获取出行轨迹数据来研究居民出行行为、掌握交通分布特征成为近年来学者们研究的热点。其中,通过挖掘分析GPS轨迹数据,获得完整的出行链信息,进行居民交通出行方式和出行目的的识别是研究出行行为的主要内容。本文在获得出行者的GPS轨迹数据基础上,采用C4.5决策树、BP神经网络、随机森林等机器学习算法识别交通出行方式并结合地理位置信息识别出行目的。首先对所采集的数据利用一定的剔除规则进行预处理,从中提取出行特征。为提高数据质量,采用五点三次平滑法对轨迹数据的速度和加速度进行平滑处理。其次,为从离散的轨迹数据中确定出行者的停留信息,利用设定的时间参数和距离参数提出了三维数据处理的时空聚类算法。根据居民停留位置和时间信息提取轨迹数据中的出行段,提取各出行段的特征参数并利用C4.5决策树、BP神经网络、随机森林三种机器学习算法识别交通出行方式,结果表明随机森林算法的效果最佳,准确率最高可达到90%。最后为弥补以往基于规则判断出行目的的局限性,利用高德地图服务,提取出行者停留区域周边的POI信息并计算信息熵,结合时空聚类算法所获得的停留时长、停留开始时间等特征,识别居民出行目的。研究结果表明,基于GPS数据对出行行为的研究能够较好地应用于出行方式的识别和出行特征的分析中,对于GPS轨迹数据在居民出行研究领域的推广、分析居民出行行为规律、促进城市交通系统的健康发展具有重要作用。本文有两个主要创新点:首先,为了将轨迹数据划分为单一交通出行方式的出行段,设计了一种三维数据时空聚类算法识别出行者停留的位置和时间;其次,在识别交通出行方式中,使用了人们较少使用的随机森林算法,得出的精度比C4.5决策树、BP神经网络等算法的识别精度更高,并且在识别出行方式的类别中,加入了常常忽略的电动自行车的识别,对其识别的准确率高达88%。