论文部分内容阅读
2015年,互联网金融的江湖风起云涌,牵动着每一位投资者的心弦。一方面,互联网金融打破了传统银行的壁垒,使得借贷者能够在线上直接实现融资,这种创新型金融模式给我国金融改革带来新的机遇,人们对互联网金融的发展也寄予了无限的期许。另一方面,与互联网金融有关的负面事件被频繁曝光,互联网金融的盈利模式备受质疑,而加强监管和降低风险将是互联网金融行业面临的首要难题。针对国内互联网金融的发展现状,抽丝剥茧将种类繁多的互联网金融产品分为三种模式:第一,传统金融的互联网化;第二,信息资金服务平台;第三,基于互联网平台开展传统金融业务。而互联网金融在高速发展的态势下,主要面临三类风险,信用风险、技术风险和监管风险。其中欺诈风险作为信用风险的主要表现形式,是互联网金融风控的关键环节,因此互联网金融反欺诈系统的建设迫在眉睫。借鉴国内外的研究成果,结合统计学和机器学习等学科知识,采用数据挖掘技术,提出了一套较为合理互联网金融的反欺诈系统。该反欺诈系统是由统计识别、模型识别、和人工识别三个模块组成,其中统计识别是采用统计方法收集、整理和分析原始数据;模型识别是使用机器学习算法,建立反欺诈模型,识别出有欺诈可能性的用户;人工识别是前两个模块的补充,对可能存在欺诈行为的用户再次审核。在反欺诈系统的理论框架下,本文以互联网金融的行业实际数据进行分析与建模。原始数据集中包含用户的消费数据、社交数据和信用数据(欺诈类型和正常类型)。基于数据挖掘方法的统计分析发现,用户的消费、社交与用户的信用类型存在一定的联系,并且用户的社交关系对用户信用有着显著影响。抽取部分训练集数据分别建立神经网络模型、支持向量机模型和随机森林模型,使用测试集数据进行验证,模型评估表明神经网络的预测效果最理想。最后,总结互联网金融反欺诈系统的研究成果,阐述研究中的不足之处,并且对建设互联网金融反欺诈系统给出合理的意见。