论文部分内容阅读
随着社会经济的飞速发展、城市化进程的快速推进以及机动车保有量的迅速提升,城市道路交通安全问题日益凸显。与发达国家相比,我国由道路交通事故造成的人员伤亡较高,也因交通事故损失了大量的经济财产。人的因素是影响交通事故发生的众多因素中的最主要因素,而驾驶员在人的因素中占主导地位。本文对数据挖掘相关技术进行简介,介绍了统计分析的相关概念、聚类分析和关联规则等数据挖掘方法。以我国某城市2015年全年交通事故数据为例,研究了城市交通事故驾驶员特征。首先对驾驶员的年龄、驾龄、性别特征以及其他非驾驶员影响因素等特征进行统计分析,又将各因素进行综合分析。通过对交通事故中驾驶员的年龄分布、驾龄分布、性别分布的分析,发现25~31岁驾驶员占发生事故驾驶员总数的25.83%,0~5年的低驾龄驾驶员人数所占比重高达35.77%,男性事故驾驶员所占比重为91.72%,远远高于女性驾驶员。同时对传统的灰色白化权聚类算法进行了改进,提出Logistic白化权聚类算法,利用改进的Logistic白化权聚类算法对驾驶员事故倾向性进行了分析,并用MATLAB实现该算法。聚类结果显示:驾龄低于5年的25~31岁男性驾驶员和驾龄在6~15年的32~45岁男性驾驶员事故倾向性最高。引用分类效用概念对两个聚类算法的精度进行评价分析,分别计算改进前后两个聚类算法的分类效用CU值。结果证明,Logistic白化权聚类算法的CU值比传统灰色白化权聚类算法提升了5.05%,证明了改进算法的优越性和有效性。最后采用关联规则Apriori算法对交通事故中驾驶员特征与其他维度数据进行广泛深入的关联分析研究,使用MATLAB实现该算法,得出大量驾驶员特征潜在的、有意义的关联规则,如60~70岁年龄的老年驾驶员发生交通事故的车身颜色种类多,而且该年龄段驾驶员在16~22时事故率高。基于数据挖掘技术,可多角度、多层次、更加全面的对城市交通事故驾驶员特征进行研究,并深入挖掘交通事故发生的潜在规律,为交通安全管理提供理论依据和决策支持。