基于集成学习的无指导保险欺诈监测研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:zxcasd456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
保险作为金融领域的一个重要组成部分,其自身的发展对于金融行业乃至国家社会保障体系都有着举足轻重的作用。在国外,保险机构的业务已经遍及企业和公民生活的每个角落,大型保险集团的业务种类繁多、客户数量众多、保险金额巨大,每天涉及的投保以及索赔申请数量都是巨大的。国内的金融业在经历了改革开放之后,也迅速地发展起来。据保监会统计,截至2011年2月全国原保险保费收入3082亿元,原保险赔付支出608亿元1,保险种类涉及财产险、人身险、寿险、健康险、人身意外伤害险、养老保险公司企业年金缴费等几大类别。然而随着保险行业的快速发展,保险欺诈也呈现出较快的增长趋势,据2009年美国保险反欺诈联盟统计,在汽车损害保险的索赔中,欺诈金额占总赔付额的17%~20%。我国的保险欺诈情况亦不容乐观。  因此近20年来,很多的国内外专家和学者对保险欺诈的识别技术和防范措施进行了深入和广泛的研究。其中欺诈监测识别方法中有指导的方法经历了传统统计方法到现在流行的神经网络方法,实验的算法和流程都比较成熟。但是对于无指导(无监督)的保险欺诈监测的研究还比较少。本文旨在对于欺诈监测识别技术中的无指导监测方法进行研究和探讨,主要完成的工作和创新点在于通过提出一套基于集成学习的无指导欺诈监测实验框架实现了对于无标签欺诈数据的自动识别和监测。并通过结合自适应的特征选择算法、数量加权距离的欺诈判别算法来以及集成学习的思想进一步提高了对于无标签欺诈数据的判别和分类学习记忆能力。整个实验的框架在一个车辆保险的数据集上进行了实验。  本文提出了一个无指导欺诈监测的实验框架,并在实验中通过加入自适应特征选择、数量加权的距离欺诈判别算法以及平衡抽样的方法进一步提高整个实验的分类准确率。最后实验结果表明无指导欺诈监测实验效果虽然要差于有指导的实验结果,但是整个方法是有效的。首先对于测试集中欺诈样本有约>65%的样本被识别出来,整体分类准确率也较高,可达到90%以上。无指导实验效果差于有指导实验主要原因在于欺诈判别算法中可以依赖的有效信息量较少。
其他文献
一、2025:该品系是72年夏繁时用加拿大油菜作母本,铁梗青为父本,杂交选育而成。低世代时曾在金山县干巷、奉贤县青村公社种子场种植,表现中熟、抗逆性强,产量较高。 75~77年
看了去年12月22日人民日报刊登的《一个欺世盗名的骗局——关于通讯〈“他没沾临漳半点光”〉严重失实的调查》一组报道,颇感震惊。象这样与事实截然相悖的报道,在近几年来
去冬今春,我县三麦先后遭受了苗期低温干旱、越冬期的严寒冰雪和抽穗灌浆期的持续阴雨,造成了出苗晚,分蘗晚,春发晚,有效分蘗期短,灌浆期短,赤霉病为害重,穗少粒轻产量低,平
当前,评价金融机构的效率问题是社会关注热点问题,越来越受到学者们的关注。然而,目前大部分的研究只是针对单个金融机构之间的效率比较,很少有将金融机构系统作为单位来进行研究
这两年,我因为做夜编工作,没有机会出去采访,但是也写过报道。稿件见报后,就会有同志问:“怎么,你最近出去啦?”我总是回答说:“不,没有,是碰上的!”两年之中我碰上的值得报
随着Internet技术的发展,越来越多的应用从桌面向网络化方向发展,Web应用程序变得越来越流行,其地位的提升也直接导致了其漏洞可能带来更加严重的安全威胁。而跨站脚本攻击是当
在华主席抓纲治国战略决策指引下,全省农村广大干部和贫下中农学五卷,批四害,抗大灾,夺高产,赢得了早稻丰收和晚稻生产的大好形势。但是,历史经验证明,晚稻能否丰收,病虫害
据、等传媒消息:12月21日至23日,哈尔滨所有分众电视屏上醒目地出现了18位中国著名诗人的肖像,屏幕下方滚动播出字幕:欢迎来自全国各地的18位著名诗人莅临美丽的冰城哈尔滨!
为了提高高速宽带光互联网的连通性和故障快速诊断能力,提出一种基于断点传输数据量化跟踪融合的高速宽带光互联网断点检测方法。首先构建宽带光互联网的节点连通图模型,进行
在21世纪的今天,互联网已深入寻常百姓家,改变人们的生活方式。互联网+供应链的模式已极大地改变了传统的供应链结构,供应链成员间的竞合关系也日趋复杂。越来越多的制造商抓住机遇,纷纷开辟直销渠道,直面消费者,感知市场变化。面对制造商的“去中介化”行为,传统零售商不断探索新出路,是否涉足网络渠道,在新的渠道结构中,如何制定决策,协调渠道冲突以积极的态度来应对互联网带来的变革等一系列的问题亟待解决。鉴于此