【摘 要】
:
保险业飞速发展的今天,保险欺诈已经成为阻碍保险业发展的重要因素之一。重疾险作为目前市面上主推的保险产品之一,一直是保险欺诈的重灾区。传统的保险欺诈检测方法具有人力成本高、更新速度慢的缺点,并不适用于业务高速发展的今天。运用机器学习方法辅助重疾险欺诈检测可以在一定程度上缓解上述问题。本文以国内某寿险公司理赔数据为基础,在此基础上使用多种数据处理方法对数据进行处理,最终使用随机森林算法进行预测建模。通
论文部分内容阅读
保险业飞速发展的今天,保险欺诈已经成为阻碍保险业发展的重要因素之一。重疾险作为目前市面上主推的保险产品之一,一直是保险欺诈的重灾区。传统的保险欺诈检测方法具有人力成本高、更新速度慢的缺点,并不适用于业务高速发展的今天。运用机器学习方法辅助重疾险欺诈检测可以在一定程度上缓解上述问题。本文以国内某寿险公司理赔数据为基础,在此基础上使用多种数据处理方法对数据进行处理,最终使用随机森林算法进行预测建模。通过对理赔案件的思考与梳理,本文首先梳理了可能与重疾险理赔欺诈相关的五个主要方面,包括赔案、保单、客户、营销员、地区等。以这五方面为基础,进一步抓取了该寿险公司数据库中与之相关的全部数据字段,并通过使用卡方检验和方差分析的方法筛选出了40余种特征。对这40余种特征进行了数据预处理之后,本文使用随机森林建立了预测模型。通过对数据的探索,本文发现,由于不同地区的欺诈甄别能力有限,其历史数据中的噪声含量会有所不同。为了识别其噪声含量,本文使用了线性回归对地区的欺诈比例进行拟合,拟合结果即为该地区的期望欺诈比例。如果该地区欺诈比例低于期望欺诈比例过多,则视为噪声大。最终通过剔除噪声大的地区数据达到优化训练数据集的目的。研究表明,经过优化后的模型在判断能力上较优化前的模型提高ROC曲线下面积约2个百分点。但优化后的模型会在一定程度上降低适用范围。除此以外,本文还比较了不同处理手段与不同算法之间的效果差异,并根据随机森林得到的特征重要性总结了在实际业务中可能会用到的相关业务建议。
其他文献
目标跟踪是计算机视觉领域的一个重要分支,广泛应用于自动驾驶、视频监控、智能交通和人机交互等领域。给定目标在视频序列中初始帧的位置和大小,目标跟踪通过对目标外观和运动状态建模以预测出目标在后续帧中的位置和大小。近年来随着深度学习的不断发展,基于深度学习的目标跟踪算法的性能开始超过传统的目标跟踪算法,其中基于孪生网络的目标跟踪算法因兼顾准确率和速度成为目前最主流且效果最好的跟踪算法之一。然而实际场景中
在风力发电初期,风电场并网后容易因电网电压故障造成严重的脱网事故。针对此现象,应用了低电压穿越技术,大大改善了风电场并网能力,但低电压穿越技术的研究对象主要以单台风机为主,关于风电场的研究甚少,因此使得一些技术并不能让风电场完全满足低电压穿越的技术标准,需要从其他方面考虑提高系统的并网性能。另外因对称故障下的电压跌落情况最严重,所以本文研究了电网电压对称故障下集电线路阻抗对低电压穿越性能的影响。为
书院是我国封建社会传播传统文化的重要场所,体现了历代统治者和文人墨客对于儒学、理学等思想学说的认可、推崇及褒扬。它物化地呈现出不同历史时期政治、经济、文化发展的情况,是物质和精神财富的复合载体。随着朝代的更替,书院的主要职能略有差异:唐代初诞生时以藏书为主;宋元时期主要是集会和讲学,兼具藏书与祭祀功能;明清则以讲学和科举并重。浙江是书院大省,历来书院的建设数量位居全国前列。明清之际,浙江的书院林立
现今,配电网是电力系统的重要组成部分,也是耗资巨大的一部分,因而对其重构是节省成本的重要一环。通过改变配电网络的拓扑结构来提高供电的可靠性和电能质量并降低网络损耗,对改善社会经济效益具有重大意义。分布式电源(DG)是一种能更好的代替传统供电的新能源,当DG并网时,对配网的控制方式、整定保护等有巨大影响,对其研究具有重要的理论意义和实用价值。首先,选择当今运用广泛的量子粒子群算法来进行配电网重构,着
研究背景:动脉粥样硬化(atherosclerosis,As)性心血管疾病(cardiovascular disease,CVD)已成为威胁人类健康的主要原因,As作为CVD最主要的病理基础,其发病机制目前尚未完全阐明,亦缺乏能够有效反映As病理改变的血液学标志物。血脂异常是As公认的独立危险因素,其中氧化低密度脂蛋白(oxidized low density lipoprotein,ox-LDL
永磁同步电机调速系统在高速、高精度、高加速度的运动控制领域得到越来越广泛的应用。当永磁同步电机在进行频繁加减速调节时,由于电机中存在耦合项的影响,会加剧造成电流波动,降低系统对转速控制的精度,因此无法满足现代工业控制“三高一体”的要求。为此,线性自抗扰控制(Linear Actice Disturbance Rejection Control,LADRC)被用于高性能调速系统。因此,本文在研究分析
目的:进入21世纪以后,我们的生活走上了快车道,生产力高速发展,人们的物质生活水平得到很大提高,我国人民已经不满足于吃穿住行这一基本社会需求,反而对生活质量及自身身体状况有了更多的关注。在如今科技日新月异的条件下,医疗水平得到了很大提升,绝经后女性骨质疏松的病例也越来越多,给患者带来痛苦的同时,也给社会带来巨大的负担,在这一大背景下,对骨质疏松症展开研究被提上日程。秉着为患者谋福利的宗旨,也为了解
党的十九大报告指出,完善和发展中国特色社会主义制度、推进国家治理体系和治理能力现代化作为全面深化改革的总目标。习近平总书记在中央政治局的学习中多次强调,要以信息化推进国家治理体系和治理能力现代化,统筹发展电子政务。发展电子政务,是打造服务型政府、建设数字政府、推进国家治理体系和治理能力现代化的重要抓手。区块链技术作为一种新兴的互联网信息技术,在金融领域广泛应用后,受到私营企业、技术独角兽公司的广泛
在专业课与课程思政协同发展的背景下,探索一条合理的、隐性的教学方法势在必行。三维构成作为设计类的重要基础课程,教学重点在于立体造型规律的把握、材料的认识、三维美学的培养以及在专业中的应用。文章在遵循三维构成教学规律的基础上,尝试将课程思政内容从教师修养、教学内容、课程安排、作业主题、实践方式等方面进行导入,探索建立合理、科学、隐性和较为全面的课程构架体系,从多方面实现协同发展的教学新目标。
随着经济整体稳步前进、技术发展,我国迎来了全面建成小康社会决胜阶段、中国特色社会主义发展关键时期,人民日益增长的美好生活需要和不平衡不充分的发展成为社会的新矛盾,我国现阶段更加重视民生和社会公平正义。人口老龄化浪潮已然到来,多种社会保障体系日趋完善,社会保险基金的平稳高效的运转也为民生稳定和谐保驾护航。虽然社会保险事业稳步发展,我国社会保障工作仍然面临诸多挑战,尤其是人口老龄化进程加快,内陆沿海区