论文部分内容阅读
随着全球范围内城市化的快速发展,城市交通安全受到越来越多的关注。行人作为所有道路使用者中最脆弱的人群,在交通事故中受到的伤害往往比较严重。然而,对于行人交通事故的环境影响机制,过往研究在交通环境数据的获取及交通事故建模等方面仍有待发展。据此,本文基于2014年及2015年上海市长宁区的行人交通事故数据,提出了基于社会感知数据及机器学习的行人交通事故研究框架。具体研究内容及成果如下:(1)基于网络核密度算法,在200米分段的路网上计算各路段行人交通事故密度。利用街景图像、感兴趣点、房价数据、基于手机信令的24小时人口网格产品等多种社会感知数据来构建街道及社区尺度下的交通环境特征,建立行人交通事故环境特征数据库。(2)通过控制训练集、验证集和测试集的一致性,根据不同道路类型和时间段,分别构建了随机森林、GBDT、XGBoost、LightGBM四种行人交通事故预测模型。各模型的平均拟合优度均在0.8左右,表明在微观尺度下利用社会感知大数据提取环境特征并进行交通事故建模是可行的。对比模型的拟合优度等方面,LightGBM模型显著优于其它三种模型,并最终用于对上海市长宁区不同道路等级的行人交通事故进行建模。(3)引入SHAP方法,通过对SHAP值的可视化分析,解释模型中各特征的作用效果,发现特征两两之间的交互影响过程。结果表明,SHAP方法对于解释机器学习模型中特征的非线性影响模式具有一定优越性。其解释性分析结果能为城市居民出行、城市道路规划、资源分配等提供有益参考。