基于机器学习与统计学模型的道路事故严重程度预测模型效果评价

来源 :东南大学 | 被引量 : 1次 | 上传用户:leilei247472145
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
道路交通事故数据分析对于交通安全有着重要意义。事故分析的重要性在于可以揭示导致事故的不同类型因素的影响。道路事故风险模型的预测准确性需要不断提高。数据挖掘方法可以用于道路交通事故数据分析。其中,统计学模型OP、MNL等以及机器学习模型CART,SVM,KNN,GNB和RF等均可用于道路交通事故的数据集分析。这给我们提供了去研究更加准确模型的机会。本文对比了基于具有不同建模逻辑的各种机器学习和统计学模型在道路事故损害程度预测中的精确度。基于香港不同地区委员会收集的道路事故数据,将这些模型用于预测与各道路事故程度等级相对应的损害严重程度。本文计算并比较每个模型在测试数据集上的预测准确性,然后进行灵敏度分析以推断解释变量对道路事故严重程度判断的重要性。并对比了OP和MNL统计学模型对于变量影响的估计。从灵敏度分析中,我们可以获得五个选定的机器学习模型对于碰撞事故严重程度的影响大小。结果表明,尽管机器学习模型的方法存在过度拟合的问题,但其相比统计学模型的方法具有更高的预测准确性。RF,GNB,KNN,SVM和CART的致命事故分类准确率分别为82.77%,55.53%,82.82%,77.93%和81.64%。特别地,CART和SVM被认为是最佳模型,他们具有最高的总体预测准确度,分别为85.78%和84.24%。
其他文献
自由空间光通信较之传统的微波通信具有更大的带宽容量,更高的传输速率,更强的抗干扰性能,更强的保密性等诸多优势,其应用前景非常广阔。但由于空间光通信容易受到大气衰减、
在砂页岩上形成的幼年紫色土,具有较高的入渗性能,特别是紫色土坡耕地中的根孔、虫孔或秸秆腐烂形成的大孔隙,会成为雨水进入土壤的优先流通道。当雨水渗至耕层与土壤下伏母
在真核生物中,核糖体负责细胞内所有蛋白的合成,而核仁(即rDNA区)是核糖体RNA合成、加工和装配的场所。rDNA区主要由串联重复序列组成,维持rDNA区重复序列的稳定性和完整性对
随着世界能源危机的加剧,风能作为可再生能源,具有分布范围广、储存量大、可再生的特点。近年来,随着风电机组单机装机容量的增大,塔架高度越来越高。传统钢塔架由于其底部直
C-N键广泛存在于各类生物活性分子及功能材料之中,探索高效的C-N键构建方法一直是有机合成领域的重点研究内容之一。Pd催化的Buchwald-Hartwig胺化反应是目前构建C-N键最为有
随着图像处理技术和医学成像技术的高速发展,越来越多的成像技术被应用于临床医疗场景中,但是医生对医疗影像的利用始终停留在人工观测的水平。如何自动化的判断病情或辅助判
本文研究了中国A股市场中资产增长异象的存在性和来源。本研究首先解决了“资产增长异象到底是否存在于中国A股市场”的问题,利用1997至2016年中国A股市场(上交所和深交所)全
高送转近年来成为国内股票市场的一种异象,但行为背后的原因学术界却并未达成一致,对交易行为的影响也鲜有研究涉及。本文根据不同的市场周期(牛、熊市),选取深市A股上市公司20
目的:通过观察夹脊电针结合神经松动术对坐骨神经损伤兔腓肠肌萎缩肌细胞凋亡情况及bcl-2、bax表达的影响,探讨夹脊电针结合神经松动术延缓骨骼肌肌细胞凋亡的相关作用机制,
作为常见的地质灾害之一,滑坡的危害很大。它是指地表土层在受到震动,或雨季大量降水造成积水、坡脚被河流冲刷和坡体受浸泡后导致整体土层下滑的大幅度变位的灾害现象,它主