集成算法在车险索赔预测建模中的应用研究

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:liganggg1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车险是我国财产保险领域的最大险种,其保费占比接近七成,且车险的保费收入水平始终保持着稳步增长的趋势。随着汽车制造业以及车联网的快速发展,更多的风险因子与动态数据需要在定价过程中被纳入考虑,因此选取合适的模型对车险索赔进行预测是我国车险行业持续稳定发展的关键。基于上述背景,本文选取了机器学习中集成算法的代表——XGBoost算法和随机森林算法对车险索赔频率进行预测,同时将结果与决策树模型和Logistic回归模型进行比较,总结出集成算法与传统模型在车险索赔预测方面的优劣。研究内容分为五个部分:第一部分为绪论。该部分介绍了本文的研究背景,分析了目前车险市场的运营现状以及车险定价领域的发展以及存在的问题,强调车险费率厘定的重要性。同时也引出本文研究的目的与意义,以及本文的创新点。第二部分为文献综述。该部分对国内外车险索赔预测的相关研究进行了梳理,为本文的研究思路提供借鉴。此外,这一部分还介绍了车险索赔分析中的风险因子,为本文在数据集的选取上提供了参考。第三部分介绍了模型理论,在这一部分依次介绍了本文的四个模型:Logistic回归模型,决策树模型,XGBoost模型和随机森林模型,重点阐述了目标函数的构建思路以及后续实证部分所需要重点关注的参数。紧接着,本文对Boosting和Bagging两种集成思路进行了对比。在评估指标方面,本文选择了混淆矩阵,ROC曲线和AUC面积,这些指标能够直观地对模型的分类结果进行刻画与对比。第四部分为实证部分,基于fre MTPL2freq和AIcrowd数据集进行实证分析。本文首先对数据集进行描述性统计,并结合不同模型进行相应的预处理工作,然后通过python分别用四种模型进行预测,并借助学习曲线对参数进行赋值与调整。最终的结果包括三个方面:第一部分为模型的预测准确度,主要借助混淆矩阵进行评估;第二部分为特征变量的重要性分析,用来比较不同风险因子对模型预测结果的影响程度;第三部分为针对样本不均衡问题的优化,该部分工作主要探究了Logistic回归模型和XGBoost模型在不平衡样本上的表现以及优化方式。第五部分为结论与展望。该部分对论文所做工作进行总结,并提出在车险索赔预测过程中,还需要进一步解决的问题,为车险索赔预测提供建议。
其他文献
现代科技的飞速发展、以及电子通信设备的广泛应用带来的电磁辐射,不仅会影响各类仪器的正常工作,也会对人体的健康产生一定的威胁。因此,研究人员一直在积极探索高效轻质的电磁波吸收材料来衰减电磁波。MOF衍生物因具有多孔结构、化学稳定性、铁磁/介电组分等特点,近年来被看作吸波材料家族中的“新贵”。本文采用一锅法结合退火工艺,首先制备了Co-MOF衍生物Co@NC,然后与石墨烯复合,形成Co@NC/r GO
学位
微波输能(Microwave power transmission,MPT)技术是一种绿色无污染的无接触式新型充电方法,突破了传统有线充电法的各种限制,可应用于机器人、射频识别、物联网节点部署、5G基站部署、无人机太空项目、危险环境能量供应等领域。微波输能系统由发射端和接收端构成,其中接收端是系统的核心部分,决定了整个系统的效率。其基本原理是利用整流电路和接收天线将自然环境中的射频能量转变为日常电
学位
农业是我国的立国之本。当前我国人均粮食拥有量已经达到了475公斤,领先世界平均水平,从总体上看,已经取得卓越的成绩。未来十年之内,我国农业将重点朝着现代化方向迈进,使综合生产力水平获得新突破,达到量质协同发展的效果。农业产业化是实现现代化建设的重要举措。产业化经营使农业生产规模日益壮大,所面临的风险也出现积聚性特征,因此以农业保险支持产业化发展、丰富风险管理的措施手段,提供有效经济补偿,这一系列举
学位
党中央、国务院多次提出建立更加公平可持续的社会保障制度。养老保险作为社会保障体系的首要一环,其中作为一支柱的社会基本养老保险长期可持续性受到广泛关注。根据《2020年度人力资源和社会保障事业发展统计公报》发表的数据,截至2020年末,我国有近4亿人参加的企业职工基本养老保险,全部一支柱参保人数约10亿人,基金收入4.9万亿元,支出约5.5万亿元,累计结余约5.8万亿元。根据财政部公布的2020年度
学位
近年来,随着我国居民健康意识和保险意识的提高,国家政策的关注和指导,我国商业医疗保险保费规模获得了较快速度的增长。相比基本医疗保险,商业医疗保险能够为我国居民提供保障范围更广,保障金额更充足的保险保障手段。但是,保费规模不断扩大的同时,保险公司在该项业务中赔付率高,盈利困难的诸多问题也不断涌现。商业医疗保险市场中,保险人和被保险人之间存在的信息不对称问题将会引起逆向选择、事前道德风险和事后道德风险
学位
本文在Grossman健康人力资本模型框架下,引入消费习惯的影响,研究带有消费习惯的最优健康投资和消费问题。假定个体在退休前将每年的收入在一般消费品和健康投资之间进行分配,目标是最大化其总效用,即退休前的超额消费的积分效用与退休时的健康资本的终端效用之和。本文对于满足常相对风险厌恶型(CRRA)效用函数的个体,通过庞德里亚金极大值原理,得到了最优健康投资和消费的解析解。最后,根据实证文献的参数进行
学位
针对物联网的低功耗、低成本及远距离传输的需求,低功耗广域网(Low-Power Wide-Area Network,LPWAN)技术逐渐崭露头脚。LoRa(Long Range)作为最具发展前景的LPWAN技术之一,获得了广泛关注。LoRa技术旨在支持大规模物联网(massive Internet-of-Things,m Io T)中大量节点的并发传输。但受信道数和传输参数的限制,目前的LoRa技
学位
量子保密通信技术借助量子物理学的基本准则实现监察窃听行为的目的,从而完成理论上绝对安全的通信模式,并开启量子时代的信息安全。连续变量量子安全直接通信是将秘密信息调制到连续变量正则分量上,并通过信道直接传输至接收方,连续变量量子信号因其可以与经典通信系统融合,且实验设备简单,其研究有利于量子安全直接通信的实用化进程。本文围绕基于双模压缩态的连续变量量子安全直接通信的关键技术展开研究,旨在设计和完善连
学位
人体姿态估计是一种根据图像/视频估计目标人物骨骼关键点的技术,其在人机交互、医疗健康、疲劳驾驶监测和生活娱乐等领域具有迫切的应用需求。由于受拍摄角度差异、目标人物瞬时运动及成像设备精度等的限制,人体姿态估计技术仍面临许多亟待解决的难题,因此深入研究人体姿态估计技术不仅具有重要的理论价值,而且具有广泛的现实应用价值。本文重点围绕利用深度学习方法提高二维复杂人体姿态估计精度问题展开研究。在充分研究并掌
学位
随着世界人口老龄化趋势日益加剧,养老问题已越来越成为我国关注的民生重点。个人储蓄寿险市场有着非常大的运营空间,传统的储蓄寿险产品,如养老金、祝寿金等产品,由于很可能跟不上因经济飞速发展而居高不下的通货膨胀率,而渐渐不能完全保障投资者的养老需求,当前我国仍然处在发展的关键阶段,购买力的波动使得投资者们更加注重能够保障稳定收益的保险产品。于是,兼有保险养老保障功能和投资保证收益功能的变额年金,逐渐吸引
学位