【摘 要】
:
世界卫生组织报告显示,交通事故已成为人类死亡的第8大原因,更是导致5-29岁青少年死亡的头号杀手,占到全球死亡人数的2.5%。因此,研究车辆碰撞的影响因素,有针对性地开展驾车宣传教育,对于降低车辆碰撞风险具有重要的社会意义。此外,随着近年来基于驾驶行为的UBI车险的兴起,对车辆碰撞严重程度的预测,同样具有广阔的商业前景。基于对历史文献的研究,本文发现两个值得进一步研究的方向:其一,现有的车辆碰撞因
论文部分内容阅读
世界卫生组织报告显示,交通事故已成为人类死亡的第8大原因,更是导致5-29岁青少年死亡的头号杀手,占到全球死亡人数的2.5%。因此,研究车辆碰撞的影响因素,有针对性地开展驾车宣传教育,对于降低车辆碰撞风险具有重要的社会意义。此外,随着近年来基于驾驶行为的UBI车险的兴起,对车辆碰撞严重程度的预测,同样具有广阔的商业前景。基于对历史文献的研究,本文发现两个值得进一步研究的方向:其一,现有的车辆碰撞因素的研究并没有全面地考虑主观因素和客观因素,同时随着新数据源的引入,已研究的因素也有值得进一步挖掘的空间。其二,在汽车碰撞预测方面,现有研究主要预测车辆是否会发生碰撞,但对无碰撞、普通碰撞和严重碰撞等碰撞程度预测的研究不足。而碰撞程度的预测对于驾乘人员的人身和财产影响是巨大的。针对以上的研究方向,本文以上海地区的数据为样本,利用大数据技术,综合分析车辆的驾驶行为、养护行为、驾驶环境等多维数据,挖掘影响车辆碰撞的新关键因素,并在此基础上构建基于机器学习技术的车辆碰撞严重程度的预测模型。主要的研究方法及内容如下:首先,利用新数据源,构建数据集,并对特征进行预处理。本文除了引入目前碰撞研究和车险定价应用较多的车辆基本信息、车联网驾控数据、天气数据之外,也纳入了相对少有研究的车联网GPS数据、车联网碰撞数据以及售后保养数据。在特征预处理阶段,分别进行缺失值填充、归一化处理、虚拟变量设置、数据分箱等操作,以生成最适合模型训练的数据集。其次,从用车习惯因素和驾驶时空因素两个角度出发,建立预测车辆碰撞严重程度的模型,挖掘对于车辆碰撞的高影响特征组和特征变量。本文构建了77个特征变量,并根据业务背景和特征属性,将其划分为七个特征组,分别为车速特征组、加速度特征组、转弯特征组、养护特征组、恶劣天气特征组、陌生环境特征组和驾驶时间特征组。基于这些特征组和特征变量,本文提出了两种预测车辆碰撞严重程度的分类模型:一种是层次二分类模型,即先分类是否发生碰撞,再区分碰撞的严重程度;另一种是三分类模型,即直接进行无碰撞、普通碰撞和严重碰撞的分类。然后,通过实验挖掘高影响的特征组和特征变量,其实验步骤是:第一步,将前人研究过的特征组作为基础特征组,建立基本模型;第二步,按照用车习惯因素和驾驶时空因素两个维度,分别加入待研究的特征组和特征变量,得到高影响特征组和高影响特征变量;第三步,将所有特征组以排列组合的形式依次加入基本模型中,以分析各个特征组之间的组合效应,挖掘最高效的特征组组合。在整体模型实验中,为了避免因某些偶然性造成的实验误差,我们采用了多模型、多评价指标、多次实验等方法规避相关误差风险。最后,基于计量经济学模型,研究车辆碰撞影响因素之间的交互效应。本文通过实验研究,发现养护特征和恶劣天气特征的两两组合,对于预测车辆碰撞具有非常明显的、超过其他任何两两特征组合的提升效果。那么,为什么它们之间的组合会产生这样的效果,其内在机制是什么,即是一个非常值得探讨的问题。本文基于计量经济学模型对于这一问题进行了研究。基于以上的研究方法,本文得到以下四个研究结果:第一,本文所建立的预测模型能够较好地实现车辆碰撞严重程度的预测。三个模型对于“无碰撞、普通碰撞、严重碰撞”的预测,平均AUC都在0.72-0.83之间,预测效果较好。第二,在影响碰撞的主观因素中,车辆养护习惯是影响碰撞最为重要的特征,其中“平均的保养时间间隔”是最高影响的单一变量。第三,在影响碰撞的客观因素中,恶劣天气出行是影响碰撞最为重要的特征,其中“低温出行”是最高影响的单一变量。第四,通过对养护特征组和恶劣天气特征组之间交互效应的研究,发现:(1)保养数量的调节作用:较高的保养频次会减弱恶劣天气对车辆碰撞的影响;(2)保养质量的调节作用:较高的保养质量会弱化恶劣天气对车辆碰撞的影响。该结果对进一步厘清影响车辆碰撞的特征之间的相互关系,解释其作用机理提供了方向。综上所述,本文对目前车辆碰撞预测还未深入研究的方面进行了探讨,实现了以下三点创新:1、通过引入新数据源,挖掘出了影响车辆碰撞的新特征。2、提出了基于机器学习的车辆碰撞严重程度的预测模型。3、提出了车辆碰撞影响特征的组合调节效应。这些都给保险公司在UBI车险的定价策略和成本控制策略上提供了有价值的启示。
其他文献
MOOCs近年来发展迅速,它是新兴信息技术和教育深度融合的颠覆性创新,为公众提高能力提供了多元化的学习方式,使学习者足不出户就可以拓展国际化视野,进一步推动全民学习和终身学习。伴随着MOOCs平台蓬勃发展,MOOCs学习者辍学率高,大量学习者没有完成课程,这种现象开始受到业界质疑和诟病,也引起学术界关注。虽然低完成率、低保持率指标与传统教育评价更为相关,并不适合以此指标评估MOOCs学习效果,但低
首例信息型市场操纵的刑事案件——“徐翔案”于2017年判决,具有里程碑意义。与传统的短线操纵不同,信息型市场操纵涉及上市公司(实体经济)与二级市场机构(资本市场)的联合操纵,操纵者利用信息发布与传播、配合公司行动和连续交易,联合操纵股价,炒作持续性更长、影响范围更广,更容易引发股价巨振、诱导大量资金跟风交易,因而更有可能发生财富的转移。特别是在减持前人为发布和传播利好信息,配合公司行动和连续交易抬
自动问答在计算机科学中占有重要地位,也是信息检索和自然语言处理领域的重要研究方向。与搜索引擎仅简单检索排序文档不同,自动问答系统提供的是更加具有语义内涵的自然语言表述。自动问答的主要任务是理解并自动回答用户提出的问题,并构建满足用户检索和推理需求的自动问题回答系统。作为一种精确的检索技术,开放域问答技术旨在为人们提供更自然、直接的信息访问交互界面。开放域问答是指不限定在一个特定领域中进行的问答,它
在行为金融理论框架下,金融异象即资产定价异常是由投资者的行为造成的,但投资者行为并不是固定的,而是会随着投资者类型以及投资者所在市场的不同而有所差异。各类投资者在不同市场下的行为是怎样的?投资者情绪和异质信念、资金约束等因素是如何影响投资者行为,是否会造成资产的定价异常?为了解答这些问题,本文主要聚焦于三类典型的投资群体,选择了套期保值者、典型的投机者——内幕交易者、不同市场之间的套利者,围绕不同
随着拥有定位能力的装置越来越轻便和普及(如智能手机和可穿戴式设备),使得用户的位置信息越来越容易被取得。许多社交网络提供用户分享轨迹数据的功能,如旅游轨迹、跑步轨迹、骑车路线和行车轨迹。另外,许多社交网络也提供用户分享位置信息的功能,如签到信息和上传包含位置信息的照片。这些包含地理信息的数据代表着用户的移动行为,如果能从这些数据中挖掘出用户的轨迹特征,则可以在社交平台上提供更多和地理相关的个性化服
社交媒体技术正在深刻改变着我们的社会,这些技术首先应用于公共生活空间,成为许多人生活的一部分。近年来,社交媒体技术在企业内部的使用越来越广泛,成为企业信息系统的重要组成部分。企业社交媒体的应用预计会对组织沟通、知识共享和合作等重要组织流程产生重大影响。由于企业社交媒体成为员工开展日常工作的重要工具,使用企业社交媒体开展知识相关的实践将促进员工知识效率,提高工作表现。但是,我们对员工为何使用企业社交
近年来,以互联网、大数据、人工智能为代表的现代信息技术日新月异,软件应用、存储、计算能力、数据等许多资源都被打包成服务的形式交付用户使用,服务作为一种新兴的软件资产正在逐步兴起。服务计算作为一种新的计算范式,为企业内部和跨企业的应用程序集成和协作提供了分布式计算基础设施。它主张通过服务的组合来构建分布式应用程序,极大地改变了软件应用程序的设计、架构、交付和使用的方式,受到了研究界和业界的广泛关注。
从“知识与道德”这对概念上看,本文秉持这样一种教育信念:知识是个体道德成长的基础,知识能够为个体道德成长奠基。这类知识并非局限于道德知识,其他学科知识同样能够为个体道德成长助力。它们都是培育个体道德必不可少的组成部分。道德知识因蕴含价值规范能够直接作用于人的行为,有助于道德的知识更多是指那些能够帮助个体解释和认识现实状况,进而实现更好的理解道德概念、作出道德行为等相关方面的知识,它们对个体行为的影
企业出于促销、质量保证和信号传递等动机采用赊销的办法进行信用销售,这些售出后没有立即收到的货款就形成了应收类债权资产,也就是应收账款和应收票据。截至2019年末,我国规模以上工业企业的应收账款规模接近15万亿,占流动资产的比例超过四分之一,约为营业收入的五分之一。过高的应收比例提升了企业的管理成本和坏账风险,很可能造成资金紧张进而影响日常的生产经营活动。当前我国经济正处于转型升级的关键期,企业部门