论文部分内容阅读
随着我国保险事业的迅速发展,保险信息量也迅速增长,导致信息的不确定性呈指数增长,尤其是保险欺诈方面的信息不确定性,对社会具有很大的破坏效应及潜在的危害。然而,传统的数据统计技术和分析已经难以达到防范要求,因此需要采用各种数据处理技术对保险欺诈行为进行有效甄别,才能进行有针对性的预测。 数据挖掘是从海量数据中提取或“挖掘”有用知识的一种新技术。将它应用于保险欺诈的防范领域,可充分利用现有的保险数据库资源来归纳正常投保用户的规律,从而区分出不符合这些规律的异常数据,解决了传统技术难以达到防范要求的问题。 信息融合技术主要应用于军事领域,它的规划识别技术是基于“等和看”的原则,包括假设式驱动模型和锁孔式测试模型两种模型。本文主要是基于假设式驱动模型建立的保险欺诈行为范例库,该范例库能够对异常数据的进行测试与捕捉。 本文结合数据挖掘与信息融合技术,建立了从三个角度出发,分三个阶段处理的识别保险欺诈行为的应用系统。第一阶段,从数据构造的角度出发,采用基于Bayes原理的AutoClass聚类算法,对保险业中的人寿及其相关险种进行了聚类分析处理。根据AutoClass聚类原理,提出了聚类模板匹配的方法识别输入的异常记录。第二阶段,从客户的经济角度出发,应用信用评估模型对这些异常记录进行筛选,识别出新的数据类型和可疑记录。第三阶段,从行为特征的角度出发,采用基于信息融合的规划识别技术,对可疑记录的行为特征进行规划识别,使系统实现了对可疑记录的预测、识别,并根据识别结果实现系统自学习。