论文部分内容阅读
摘 要: 近些年,保险行业得到迅猛发展,同时,保险欺诈活动应运而生。面对保险欺诈,很多保险公司往往一筹莫展,导致骗赔猖獗。如何从以往的拒赔案件信息中,抽取有效识别欺诈案件的模式,促进保险业持续健康发展,成为保险行业研究的关键。数据挖掘在处理大批量数据,挖掘潜在关系方面具有无可比拟的优势。本文提出利用神经网络算法,从历史赔案信息中训练出识别欺诈案件的模型,并抽取赔案数据进行模型效果测试。实验证明,通过此模型筛选出的高理赔用户群具有较高准确率,此数据对保险工作人员具有一定的指导作用。
关键词: 高风险理赔 神经网络算法 数据挖掘
1.引言
目前,我国保险业正处在发展的重要时期。一方面,保险业务和保险产品在社会上有一定量的需求,保险业已经成为国家的一个重要行业,并正处于朝气蓬勃的发展阶段。另一方面,保险业的发展出现诸多问题,尤其是保险欺诈问题日益严重。在过去十多年中,各种各样的保险欺诈案急剧上升。据《中国保险报》报道,某些保险险种因被欺诈导致的赔款支出最高可达保费收入的50%,全部业务被欺诈导致的赔款支出估计约为10%~30%[1]。中国人民大学统计分析和数据挖掘和商业智能应用研究小组就某保险公司1998~2002年的理赔数据分析,高危人群理赔率为12.73%,远远大于总体比例的受理赔率3.66%[2]。面对日益猖獗的保险欺诈,我国部分商业保险公司还没有采取行之有效的措施。他们把研究该问题的关键集中在扩大保险费收入总量上,没有意识到保险欺诈给保险公司及当事人带来的严重危害。处理海量数据时,数据挖掘技术具有无可比拟的优势。近年来,国内外很多文章从多方面专门探讨数据挖掘在不同保险行业中的应用。
从一个全新角度切入,数据挖掘技术为保险公司提供可以处理海量信息的方法,将收集到的海量数据通过该技术,了解拥有的客户的具体类型,以及其中什么特征的客户存在高风险。由数据挖掘结果可以更清楚地知道未来目标客户群在哪里,针对该客户群推荐保险理赔产品进而获得更大效益。
我国寿险行业经过近二十年的发展,积累了大量客户数据及大量理赔用户数据。
本文引入神经网络算法,分析大量理赔用户数据,把这些高危理赔人员分离出来,集中分析,同时找到保单中风险较大的区域,从而得到一些实用的控制风险的规则,以便对保险公司的工作起到指导作用。
2.神经网络算法
神经网络结构是由多个简单处理单元彼此按某种方式相互连接而形成的一种计算机系统,通过对连续或断续式的输入做状态响应,该系统能够进行信息处理。尽管每个神经元的结构和功能相对比较简单,但由大量神经元构成的网络系统的行为丰富多彩和相当复杂。研究发现该算法具有以下优点:非线性映射逼近能力、高强的容错能力、对信息的并行分布式综合优化处理能力、对学习结果的泛化能力和自适应能力、便于集成实现和计算模拟等[3]。
3.模型构建
神经网络算法模型构建具体过程一般需要四步:
第一步:数据收集,从而获取建模所需的客户数据,其中数据项的选择等工作直接决定了最终建立的模型是否与研究目标一致;
第二步:预处理数据,对初始客户数据进行预处理,因为初始客户数据并不一定符合我们的建模要求,其中会有数据噪声等多种问题存在,所以对其进行预处理是保证建模结果准确的必然要求;
第三步:根据收集的特定的一群数据,通过训练这些数据,得出该数据群的特征,存入特征数据集合中;
第四步:有特征集合和分类算法,构造分类器;如图1所示。
建立好神经网络算法模型,对于新加入的用户数据,可以通过图2进行检测,首先将待检测的用户信息向量化,让其符合特定格式,通过分类器进行分类,通过比较得出结论。
4.实例分析
经过几十年发展,保险行业已经积累了海量理赔数据,足够我们构建一个神经网络算法模型。
第一步:将大量理赔数据资料进行预处理,提取出我们需要的向量(编号,年龄,收入水平,可信度),将这些作为训练数据;第二步:将训练数据按照分类算法得到分类规则,将分类规则放入特征集合中,如图3所示;
建立好分类算法模型后,当保险公司发现可疑用户时,可以利用建立好的分类算法模型进行测试,提取用户信息,按照得到特征集合中的分类规则进行分类,判断该用户属于哪一类。
5.结语
对保险公司而言,其很希望每个人都买保险,但是不要出事故,但是对于每个人而言,由于生活中各种各样的不确定性因素,甚至会出现骗取保险的现象。如何有效且准确地识别出这些人群,对保险公司具有重要意义。本文采用神经网络算法,筛选出高理赔的用户群,并举例对实验结果进行分析,从而给予保险公司有益的改善意见。
参考文献:
[1]唐红祥.投保方保险欺诈问题研究[J].广西财政高等专科学校学报,2004,17(3):42-55.
[2]张健,冯建华.数据顸处理在保险理赔预测中的应用[J].计算机工程,2005.9:2537-2539.
[3]谢承泮.神经网络发展综述[J].科技情报开发与经济,2006,16(12):148-149.
[4]陈永强,胡雷芳.数据挖掘技术在人寿保险CRM系统中的应用研究[J].现代生产与管理技术,P39-42.
[5]黄晶晶.数据挖掘技术在医院医保费用分析屮的研究与应用[D].广州:南方科技大学,2009.
关键词: 高风险理赔 神经网络算法 数据挖掘
1.引言
目前,我国保险业正处在发展的重要时期。一方面,保险业务和保险产品在社会上有一定量的需求,保险业已经成为国家的一个重要行业,并正处于朝气蓬勃的发展阶段。另一方面,保险业的发展出现诸多问题,尤其是保险欺诈问题日益严重。在过去十多年中,各种各样的保险欺诈案急剧上升。据《中国保险报》报道,某些保险险种因被欺诈导致的赔款支出最高可达保费收入的50%,全部业务被欺诈导致的赔款支出估计约为10%~30%[1]。中国人民大学统计分析和数据挖掘和商业智能应用研究小组就某保险公司1998~2002年的理赔数据分析,高危人群理赔率为12.73%,远远大于总体比例的受理赔率3.66%[2]。面对日益猖獗的保险欺诈,我国部分商业保险公司还没有采取行之有效的措施。他们把研究该问题的关键集中在扩大保险费收入总量上,没有意识到保险欺诈给保险公司及当事人带来的严重危害。处理海量数据时,数据挖掘技术具有无可比拟的优势。近年来,国内外很多文章从多方面专门探讨数据挖掘在不同保险行业中的应用。
从一个全新角度切入,数据挖掘技术为保险公司提供可以处理海量信息的方法,将收集到的海量数据通过该技术,了解拥有的客户的具体类型,以及其中什么特征的客户存在高风险。由数据挖掘结果可以更清楚地知道未来目标客户群在哪里,针对该客户群推荐保险理赔产品进而获得更大效益。
我国寿险行业经过近二十年的发展,积累了大量客户数据及大量理赔用户数据。
本文引入神经网络算法,分析大量理赔用户数据,把这些高危理赔人员分离出来,集中分析,同时找到保单中风险较大的区域,从而得到一些实用的控制风险的规则,以便对保险公司的工作起到指导作用。
2.神经网络算法
神经网络结构是由多个简单处理单元彼此按某种方式相互连接而形成的一种计算机系统,通过对连续或断续式的输入做状态响应,该系统能够进行信息处理。尽管每个神经元的结构和功能相对比较简单,但由大量神经元构成的网络系统的行为丰富多彩和相当复杂。研究发现该算法具有以下优点:非线性映射逼近能力、高强的容错能力、对信息的并行分布式综合优化处理能力、对学习结果的泛化能力和自适应能力、便于集成实现和计算模拟等[3]。
3.模型构建
神经网络算法模型构建具体过程一般需要四步:
第一步:数据收集,从而获取建模所需的客户数据,其中数据项的选择等工作直接决定了最终建立的模型是否与研究目标一致;
第二步:预处理数据,对初始客户数据进行预处理,因为初始客户数据并不一定符合我们的建模要求,其中会有数据噪声等多种问题存在,所以对其进行预处理是保证建模结果准确的必然要求;
第三步:根据收集的特定的一群数据,通过训练这些数据,得出该数据群的特征,存入特征数据集合中;
第四步:有特征集合和分类算法,构造分类器;如图1所示。
建立好神经网络算法模型,对于新加入的用户数据,可以通过图2进行检测,首先将待检测的用户信息向量化,让其符合特定格式,通过分类器进行分类,通过比较得出结论。
4.实例分析
经过几十年发展,保险行业已经积累了海量理赔数据,足够我们构建一个神经网络算法模型。
第一步:将大量理赔数据资料进行预处理,提取出我们需要的向量(编号,年龄,收入水平,可信度),将这些作为训练数据;第二步:将训练数据按照分类算法得到分类规则,将分类规则放入特征集合中,如图3所示;
建立好分类算法模型后,当保险公司发现可疑用户时,可以利用建立好的分类算法模型进行测试,提取用户信息,按照得到特征集合中的分类规则进行分类,判断该用户属于哪一类。
5.结语
对保险公司而言,其很希望每个人都买保险,但是不要出事故,但是对于每个人而言,由于生活中各种各样的不确定性因素,甚至会出现骗取保险的现象。如何有效且准确地识别出这些人群,对保险公司具有重要意义。本文采用神经网络算法,筛选出高理赔的用户群,并举例对实验结果进行分析,从而给予保险公司有益的改善意见。
参考文献:
[1]唐红祥.投保方保险欺诈问题研究[J].广西财政高等专科学校学报,2004,17(3):42-55.
[2]张健,冯建华.数据顸处理在保险理赔预测中的应用[J].计算机工程,2005.9:2537-2539.
[3]谢承泮.神经网络发展综述[J].科技情报开发与经济,2006,16(12):148-149.
[4]陈永强,胡雷芳.数据挖掘技术在人寿保险CRM系统中的应用研究[J].现代生产与管理技术,P39-42.
[5]黄晶晶.数据挖掘技术在医院医保费用分析屮的研究与应用[D].广州:南方科技大学,2009.