论文部分内容阅读
零膨胀计数数据广泛存在于农业、医疗、工业、保险等领域,Hurdle回归和零膨胀回归模型是分析处理该类数据最有效的两类回归模型。ZIP和PH回归模型是处理零膨胀计数数据的常用模型,但二者仅能解决计数数据存在的零膨问题,ZINB和NBH回归模型分别作为ZIP和PH回归模型的拓展,既能解决计数数据存在的零膨胀问题,又考虑了计数数据由未观察到的异质性和事件发生相关性所导致的过度离散。随着经济的飞速发展,交通事故发生愈加频繁,引起国内外学者的广泛关注。而交通事故伤亡人数往往是具有零膨胀特点的计数数据,可采用Hurdle回归和零膨胀回归模型对其进行回归拟合,同时将Hurdle回归和零膨胀回归模型的应用研究推广到交通事故的新领域。PH和ZIP回归模型拟合交通事故数据,考虑了伤亡人数的零膨胀特点,能够有效改善普通计数回归模型的拟合效果,增加结论准确性;而NBH和ZINB回归模型作为PH和ZIP模型的有效拓展,同时考虑了计数数据零膨胀和过度离散特征,对不但具有零膨胀特点而且存在因个体间异质性引起的过度离散特点的人员伤亡计数数据,为最优理论模型。本文通过对交通事故数据分析研究,将不同计数回归模型应用于交通事故人员伤亡的影响因素分析,并通过模型选择方法进行比较,得出如下结论:1、交通事故多发生在出行较密集的月份和时点;发生在晴天的事故数明显多于阴、雨天气;交通事故造成财产损失在1,000元以下比较集中,万元以上的大额损失相对较少;发生事故的车辆驾驶者年龄多数在23-45岁。2、ZINB回归模型为此交通事故数据中人员伤亡影响因素分析的最佳适用模型。3、在影响交通事故的诸因素中,肇事车辆有无牌照、车损情况,天气状况以及肇事司机驾驶资历等因素对事故人员伤亡影响显著。4、ZINB回归模型在交通事故伤亡人数的影响因素分析中的分析结果与交叉分析结果基本一致,进一步验证了将ZINB回归模型应用在交通事故伤亡人数影响因素分析中的合理性。文中仅考察研究了天气,肇事车辆车型、有无牌照、车损情况,驾驶人年龄、驾驶资历等事故影响因素对伤亡人数的影响,而Hurdle回归和零膨胀回归模型在数据量比较大的数据资料拟合中更为适用,因此,可以进一步收集大量数据并选取更多事故影响因素进行分析以得到更加完善的结论。