论文部分内容阅读
随着城市化的快速发展和道路机动化进程的实现,人民群众的生活变得更加便捷。与此同时,机动车的大量使用也造成了交通拥堵、空气污染和交通事故等一系列社会问题,给政府的交通管制造成巨大的压力。其中,频繁发生的交通事故给人们的安全和社会财产都带来了巨大的损失。交通事故风险预测的结果可以帮助城市管理者合理地调配警力来舒缓交通压力,避免交通事故的发生,也可以为行人的出行提供安全性指导。因此,研究城市区域在未来一段时间的交通事故风险具有重要的现实意义和很高的社会价值。传感器的大量普及和数据收集的工作广泛应用,使得人们可以获取大量与交通事故有关的多源异构数据。人们不再仅仅挖掘交通事故本身或者流量监控数据的影响,而可以更加全面地研究交通事故风险。本文通过对多源异构数据进行预处理,借助机器学习和深度学习的模型,以达到实现精确而有效地预测城市区域交通事故风险的目的。论文的主要工作如下:1.多源异构数据集的分析和预处理。首先,分析了与交通事故相关的一系列多源异构数据集对交通事故的影响,包括交通事故数据、不同车辆的出行数据、天气数据、道路设计数据和兴趣点数据等。然后,根据各个数据集的时空特性,对数据进行了相应的预处理,包括数据的时空对应、缺省值填补、特征抽取和数据归一化等。最后,总结出一套适用于研究交通事故风险预测问题的预处理流程,将所有的数据处理成适用于交通事故风险预测的模式。2.提出了一个包含了时空注意力机制的深度学习框架TA-STAN,用来解决基于城市区域的交通事故风险预测问题。该模型在传统的编码器-解码器结构上加入了空间注意力机制和时间注意力机制,主要包括3个部分:(1)空间注意力机制。在编码器阶段,使用了两种空间注意力。其中,局部空间注意力用来拟合当前区域历史的不同交通指标对本地未来交通事故风险的动态影响,全局空间注意力用来拟合全局所有区域历史的交通指标对本地未来交通事故风险的动态影响;(2)时间注意力机制。在解码器阶段,使用了时间注意力去拟合未来不同时间戳的预测值与历史时间戳的动态关系;(3)外部环境特征融合模块。在解码器阶段,将天气特征、时间特征和道路设计特征等外部环境特征嵌入处理之后作为最终预测的一部分输入,设计了一个特征融合模块,用于更加精确地拟合未来一段时间的交通事故风险情况。实验结果表明,TA-STAN模型在三个评价函数上都优于传统的机器学习模型。更重要的是,通过可视化注意力机制中的注意力权重,人们可以合理地解释注意权重所代表的实际意义,与现实场景相符合。