论文部分内容阅读
随着我国经济社会发展和城镇化、机动化进程的不断加快,城市交通安全问题日益严峻,已成为道路交通事故新的增长源。城市道路交通事故不仅严重威胁人民群众的生命财产安全,更成为导致交通拥堵蔓延和路网瘫痪的主要诱因。为了提高城市交通安全,欧美等主要发达国家近年来逐渐加强了城市路网的交通事故风险研究。但是,目前现有的城市路网交通安全研究存在四方面局限:(1)城市路网的交通曝光度量不够准确,交通曝光变量的采集通常依赖城市范围内布设稀疏且覆盖范围局限的传感设施。因此,交通曝光变量在很大程度上不能表征城市路网的真实交通曝光值,大大影响了城市路网交通事故风险模型的准确性和有效性;(2)现有的交通事故建模中所有的出行活动混杂在一起,无法剥离出不同类型的出行活动对城市路网交通安全的影响,大大制约了区域交通管控的准确性和实施效果;(3)城市路网交通事故模型中,影响变量通常具有显著的空间自相关性,传统的事故模型缺乏对该方面的考虑,大大制约了模型的解释能力和预测性能;(4)现有的城市路网交通事故建模基本都是从一个比较长期的、平均的角度去对安全做定性的评估,是一种静态的评价方法,无法对实时的交通事故风险进行动态判别。随着信息技术的发展,城市道路交通系统每天产生海量庞杂、异质多源的数据,蕴含着能够准确描述复杂交通系统运行态势的信息。城市的手机终端、浮动车、公交智能刷卡等时刻向我们提供着交通参与者的位置和出行活动信息。本文以国家自然科学基金优秀青年基金《交通安全和设计》为依托,从多源大数据中深入挖掘用户的出行活动与出行特征信息,弥补传统交通曝光变量评估的笼统性和局限性;在此基础上,充分考虑变量的空间相关性,构建城市路网交通事故模型,系统认知城市路网的交通出行行为特征、道路网络结构、社会经济与人口特征以及交通事故风险间的耦合关系;建立基于时空深度学习的城市路网短时事故风险预测模型,捕获城市路网事故风险的复杂时空关联性,揭示城市路网交通事故风险的动态演化机理,在此基础上实现安全导向的城市交通规划与道路管控。论文的主要研究内容可以具体分为如下几个方面:首先,详细阐述了影响城市路网交通事故风险的影响因素,主要包括交通曝光因素、道路因素、人口与社会经济因素以及环境因素。重点讨论传统研究中采用的交通曝光变量,以及这些变量在评价交通小区出行行为和交通曝光方面的局限,探讨利用城市多源交通大数据提取交通出行信息的可行性。其次,详细讨论了如何从新兴的多源大数据中提取交通出行信息。具体来说,基于社交媒体数据,探讨基于推特签到数据的出行活动提取与分类方法,提出面向推特用户的家庭住址推测算法和出行半径估算方法;基于出租车OD数据,结合城市用地特征信息,利用隐狄利克雷分布模型挖掘隐藏的出租车出行特征,并结合随机森林方法进一步提炼出影响城市路网交通事故风险的关键出行特征变量;基于大规模地铁旋转门感应数据,利用核密度估计法对城市路网的地铁出行进行空间分配,估算出每个交通小区的地铁出行需求。第三,研究探讨城市路网交通事故建模中解释变量间存在的空间自相关性,在此基础上,提出了基于地理加权泊松回归的城市路网交通事故模型。研究对比了基于多源数据提取的交通出行信息与交通事故在时间和空间上的分布特征,探讨了不同出行活动与出行特征和城市路网交通事故之间的耦合关系。在此基础上,研究对比了不同数据源融合下的城市路网交通事故模型,探讨了多源数据的融合对提高交通事故模型鲁棒性的作用。此外,研究还进一步讨论了单个交通大数据源情况下,样本的有偏性对城市路网交通事故建模的影响。第四,研究利用城市多源感知数据对城市路网短时事故风险进行预测,结合深度学习理论,提出了面向城市路网短时事故风险预测的时空深度学习网络;通过融合卷积神经网络、长短时记忆网络以及卷积长短时记忆网络,可以准确捕捉区域交通事故风险在时间和空间两个维度的变化特征;研究对比了不同时间和空间维度下的模型预测性能,分析了常见的统计建模方法和机器学习方法在不同短时事故风险预测情境下的模型效果。最后,研究进一步利用国内数据对提取出的城市路网交通事故模型进行应用研究,以北京市为例,研究利用微博签到数据,提取交通参与者的出行活动信息。同时,利用北京市中心城区一周的出租车出行数据与用地特征进行结合,提取了我国出租车的主要出行特征。最后,利用之前训练好的时空深度学习网络,对北京市中心城区的交通事故风险进行预测,并讨论了事故风险的时空变化特征和传播机理。