论文部分内容阅读
随着交通越来越发达,带给人们便利的同时,也带来了交通拥堵、城市安全等问题。对于我国交通信息化进程的加快,为从海量交通数据分析人们出行特征和构建预测模型来解决交通问题提供了可能。本论文利用机器学习技术研究挖掘交通数据中存在的规律,为人们的出行、市府规划、旅游局管理提供参考数据。数据主要来源是公交IC卡数据和手机信令数据,这两种数据有着很强的应用价值。利用机器学习算法,进行有针对性设计,对交通数据进行研究分析。(1)论文首先是对基于IC卡数据的幂率分布的研究与分析;先是分析IC数据的特征和分布,提出了非限定性分站算法,得出了站与站的时间间隔,然后用两个不同地区的数据进行验证,得出了非限定性分站算法的可用性。接着对得到的公交车站与站的时间间隔进行分析,发现其具有重尾现象,是符合人类行为动力学的。并且通过机器学习线性回归算法对时间间隔数据建立模型,得出站与站的时间间隔是服从幂律分布,本文对IC卡数据的分析为公交车的调度打下了理论基础。(2)接着论文对手机信令的数据进行研究分析,提出了基于置信度的自适应密度聚类算法研究手机信令时空分布特征;并以沿海地区的外省游客作为主要的研究对象,通过基于置信度的自适应密度聚类算法与传统的密度聚类算法进行对比分析,与可视化工具得到的热力图进行参照分析,分别说明算法的优越性和准确性。本章的目的在于通过手机信令数据挖掘出某沿海城市十一黄金周旅游高峰时期游客在不同地区的主要的活动地点,得出交通流量的主要分布地点。(3)最后论文研究的是基于手机信令数据的人流量预测,通过对旅游城市在旅游黄金周(十一黄金周)的数据按照不同地区人流量的分布进行分析,然后用LSTM算法和ARIMA算法对不同地区的数据集进行预测,通过实验证明了LSTM预测算法对旅游城市不同地区在旅游黄金周人流量预测的高效性和可用性;预测出了旅游城市不同地区在未来某一段时间内的人流量变化趋势,为旅游人员提供了一个参考方案,也为旅游城市不同地区的交通管理和公共安全提供了有利的帮助,使得交通的模式由实时监控变成未来可预测。论文通过提出非限定性分站算法、线性回归算法、基于置信度的自适应密度聚类算法、LSTM算法,然后通过实验进行论证,证明了提出的算法对交通数据挖掘的可行性和有效性,在城市规划、公共安全及交通管理方面有着一定的研究价值以及应用价值。