论文部分内容阅读
预测交通事故损伤严重程度并根据分析结果提出降低事故损伤的方法是汽车安全技术研究的重点之一。本文基于特征选择算法构建交通事故损伤严重程度预测模型,模型以美国国家公路交通安全管理局建立的FARS(Fatality Analysis Reporting System)数据库系统中记录的非驾驶员行为导致的追尾事故数据为例,探究影响因素与事故损伤严重程度之间的内在规律,为无人驾驶车辆和辅助驾驶车辆降低事故损伤严重程度提供安全措施和改善建议。主要工作如下:(1)本文根据特征选择算法的工作原理,将其两个分类Filter式和Wrapper式相结合。选择Filter特征选择算法中信息度量的两个指标:基尼指数和互信息;然后在Wrapper特征选择算法的基础上,采用基于基尼指数和互信息相结合的方法综合评估变量特征重要性并以此作为广义序列向后搜索策略(Generalized Sequence Backward Selection,GSBS)的依据。特征选择算法和C4.5决策树(C4.5 Decision Tree,C4.5),随机森林(Random Forests,RF)以及支持向量机(Support Vector Machine,SVM)三种分类器构建交通事故损伤严重程度预测模型。(2)对追尾事故的致因以及影响因素进行初步分析,然后以FARS中2010-2017年的追尾事故数据作为数据来源,剔除缺失和因驾驶员行为造成的事故记录。经过数据整合和数据格式预处理后,共获取6295条事故记录,将人员的损伤严重程度作为因变量,从人、车、路、环境方面初选出23个潜在影响因素作为自变量。(3)在进行特征筛选循环过程中,首先通过综合评估准则对数据集中的变量进行评估打分和排序,记录此时模型的分类准确率,然后按照GSBS方式依次移除M个得分最小的变量,生成新的数据集重新开始循环,直到数据集中的变量为零时终止循环。结果表明,通过引入综合评估准则,模型能够快速准确的筛选出重要变量,分别为:安全带、相对速度、安全气囊、车重、车辆损坏程度、车辆类型、年龄、翻车、着火、路面环境、天气,时间段和乘员类型;同时也提高了预测模型分类性能。(4)本文通过分类准确率和召回率对比三种分类器的分类性能,结果表明SVM的分类性能整体上最好,其次是RF和C4.5。本文在最后通过SVM对筛选出的重要变量进行伪弹性分析和敏感性分析,确定重要变量对事故损伤严重程度的影响。根据分析结果对无人驾驶车辆和辅助驾驶车辆提出了相应的安全措施和改善建议。