基于机器学习算法的车险索赔频率问题研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:betty5918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国财险公司保费收入稳步提升,且国内非寿险市场70%以上都是车险业务,因此车险费率厘定的研究对于整个非寿险行业具有重要的理论及现实意义。索赔频率作为车险费率厘定的重要环节,在整个费率厘定过程中必不可少。而随着互联网、物联网的飞速发展,保险数据在快速膨胀,如何充分利用各种有效的工具从从海量的保险数据中挖掘出有价值的信息对于提升车险索赔频率预测准确性具有重要的价值意义。本文基于法国商业机动车第三者责任险保单索赔数据,选用机器学习算法中的神经网络算法、回归树算法与XGBoost算法对车险索赔频率问题进行研究,并以样本内外损失函数的最小化为标准,与传统的广义线性模型进行对比,从中选取相对较优的模型对测试集样本索赔频率进行预测。研究结果表明,经过严格参数调整的机器学习算法在处理具有大量数据的车险索赔频率预测问题上优势较为明显,体现在因变量和自变量不需要服从一定的分布假设、数据处理效率较高且在一定程度上可以提高保险损失预测的精度。但是同样存在的问题是,机器学习算法模型训练的过程需要耗费大量的时间,且建模过程中的人为干预较多,对使用者的编程能力要求较高,输出结果的可解释性不及广义线性模型,对于大多数使用者而言是黑盒状态。现有研究机器学习算法应用于车险业务的文章多以实现分类任务为主,较少涉及到用回归方法解决预测问题,且目前国内还没有将用于车险索赔频率预测问题的XGBoost算法与传统广义线性模型的泊松回归方法进行比较,此外国内外学者在预测车险索赔频率问题中也较少采用浅层神经网络算法。基于此,本文研究以回归为基础的机器学习算法,采用了浅层神经网络算法、回归树算法、XGBoost算法来研究车险索赔频率预测问题,具有学术意义的同时也具有重要的实践作用。学术方面,神经网络模型、回归树模型、XGBoost模型在处理无分布规律的数据上非常有优势,而在保险实务中由于数据量庞大,许多数据并没有良好的服从某一特定分布的特性,此时这几种算法就可以发挥他们的特长,为保险公司在数据处理方法选择上开辟新的路径,提高保险公司的风险管理水平。此外由于本文选取了多种机器学习算法进行研究,所以也扩大了车险实务中的算法选择范围,并通过基于样本内外损失的比较为车险索赔频率问题的算法应用作了尝试性研究,尝试打开算法黑盒的同时提供理论引导。本文结构如下:第一章为引言;第二章为模型理论;第三章为基于不同算法的索赔频率预测;第四章为结论与建议。在第一章引言中,简要说明了我国汽车保险的发展状况,机器学习的常见算法,总结了国内外机器学习算法赋能车险业务研究现状,根据我国车险业发展状况提出了使用机器学习算法预测车险索赔频率的可能性与必要性。在对国内外有关文献进行综述的基础上,简述了文章的研究方法与主要创新点。在第二章模型理论中,对本文使用的GLM模型、浅层神经网络模型、回归树模型、XGBoost模型进行详细理论拆解,其中涉及到神经元结构、浅层前馈神经网络、激活函数选取、决策树模型、回归树剪枝算法等内容,实现了对机器学习算法黑盒的部分透明化。在第三章基于不同算法的车险索赔频率预测当中,通过使用不同算法模型对索赔频率进行基于样本内外损失的拟合与预测,利用网格搜索法预先设定模型的局部最优参数,并通过对训练集不断训练以及对预测集进行交叉验证等方法来进行调参,以最终确定此种模型对于这一数据集来说选定的最优参数。然后以模型样本内外损失最小化为标准对四个模型的拟合与预测效果作比较,并从中选取最优的XGBoost模型对样本测试集数据作预测,并用RMSE计算其与真实值的平均误差,得到模型对测试数据具有较好的适应性。在第四章的结论与建议中,首先对本文研究的机器学习算法应用于车险索赔频率预测问题进行了总结,随后结合我国实际情况,从车险业务、保险公司、政策监管三个角度对提高保险公司应用机器学习算法能力、加快我国保险数字化转型提出尝试性建议。
其他文献
新时代的网络技术更迭极为快速,这也让广大民众的生活方式产生了很大的转变,立足网络人们可以完成越来越多的事情,媒介传播和营销环境都已经与传统环境有了显著地不同。在这种背景下之下,品牌管理研究同样发生了明显的改变,具体体现为:理念转变,从交易营销-关系营销;传播方式转变,营销本位-品牌本位的;传播内容转变,产品之上的品牌传播-买卖双方价值供销传播;价值体系转变,建立多维价值体系;探究对象转变,品牌对顾
学位
随着居民财富的不断增加、受教育程度的不断提高,越来越多投资者选择投资基金产品。尤其近几年来,监管层加大了对信托行业“治乱象、去通道、防风险”的力度,信托行业规模持续萎缩,以及“十四五”期间楼市“房住不炒”主基调没有改变,基金投资逐渐受到投资者的欢迎。在基金市场中,公募权益类基金以其超高的投资回报率吸引了大量的投资者,而市场上权益类基金产品受基金经理个人能力、宏观经济环境以及行业发展趋势等因素的影响
学位
随着全球化趋势的不断加深,供应链管理在企业运营中的重要性不断提高,而作为供应链的首要环节,采购已经成为企业为了增加行业竞争力需要考虑的关键。企业进行采购的目标是明确何时向哪家供应商购买多少数量的产品。为了降低风险和保护自身利益,企业会同时考虑多家供应商,因此在采购过程中,企业常常面临着供应商如何选择和订单如何分配等问题。传统的采购主要是控制成本和质量,随着21世纪的到来,面对竞争更加激烈的市场环境
学位
当前,在新一轮课程改革中,注重对学生进行核心素养培养,成为当前初中数学教育的一个主要目的和使命。初中生的核心素养培养有助于提高学生的数学运算能力,从而提高学生的整体发展和全面的数学学习。为此,本论文从核心素养角度出发,就如何提高初中生的数学运算能力进行了详细的研究,希望能够为初中生养成良好的数学运算能力,提高学生的核心素养起到一定的作用。
会议
中小板指数由深圳证券交易所2005年发布,此后每六个月需要对入围的中小板股票按照日均成交金额和日均总市值排序进行成份股调整。按照中小板指编制规则,成为指数样本股的企业有较好的股票市场表现、财务指标与经营成果,每半年一次的中小板指调样事件发布向市场传递了有价值信息。对于新增股来说,收获了分析师与外部投资者的更多关注,融资渠道更加畅通,提高了企业知名度,与此同时管理层更加重视声誉,避免短期行为,选择对
学位
我国深交所的创业板市场成立于2009年10月,在核准制的发行制度下平稳的运行了十余载。2020年6月,创业板注册制改革配套法律法规正式落地。2020年8月24日首批18家上市企业通过注册制登陆创业板,标志着中国资本市场改革再次向前迈出了一大步。创业板市场从核准制转变为注册制,其新股定价效率是否得到了提升?本文从理论研究出发,结合实证研究,通过建立数据模型,探讨注册制改革与创新是否能够系统地、有效地
学位
电子信息行业作为国家重点支持高新技术型行业,需要持续创新来提升自身核心竞争力,需要足够资金供给量来保持其成长能力,因此,电子信息行业应该具备较高的融资能力。本文通过分析电子信息行业融资能力现状及存在问题,分析影响其融资能力影响因素。通过实证分析,从时间维度出发,在中央提出的干部年轻化、高学历化转折时期这一背景下,管理层能力特征对融资能力具有重大的影响,采用结构方程系统考量融入管理层能力特征后企业融
学位
当前,在国内外的汉语课堂教学中,对中文影视资源的应用越来越频繁。领域内的学者们早已论证了中文影视资源的理论价值,并提出较多使用建议。实践方面,有关于选择影视资源进行教学设计和教学实践的研究、采用实验对比方法验证中文影视资源在汉语教学中的作用研究、根据影视资源改编汉语教材的研究。其中,针对不同国别使用中文影视资源的现状、特点及问题的调研也逐渐增多。这些研究推动了中文影视资源在海外汉语教学中的发展,丰
学位
短短三十年的发展,A股市场已经经历了数轮风风雨雨和荡气回肠牛熊转换,每一次转换必然是一堆人的狂欢和一群人的落寞。毕竟A股市场起步较晚,各类市场机制建设并不是很完善,比如IPO制度、市场运行监管、退市制度、投资者保护措施等方面,依然有很多方面的欠缺,而这些漏洞总能被有心之人所利用,进而来破坏市场运行,所以这些方面依然有显著的完善空间。除了各类市场机制建设有所欠缺外,A股市场的投资主体在大多数时间都是
学位
区域经济发展情况是地方政府进行绩效考核的重要指标,但1994年分税制改革和1995年的新预算法导致地方政府事权和财权的失衡,地方政府开始纷纷设立城投平台作为融资主体,进行城市基础设施建设和公用事业建设。城投债已成为我国信用债市场的重要品种,不管对于投资者还是监管部门,研究城投债的估值定价逻辑都具有重要的意义。但是由于城投债的发行主体为地方政府融资平台,与地方政府具有特定的联系,因此相对于一般产业债
学位