基于模糊二范数无核二次曲面支持向量机的信用卡欺诈检测研究

来源 :东北财经大学 | 被引量 : 8次 | 上传用户:j2eeweb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球经济的不断发展和金融市场的进一步开放,国内外信用卡市场不断扩张,信用卡已经成为非常普遍的支付工具,同时也成为银行业收入的一个重要来源。我国信用卡起步较晚,经过30多年的发展,信用卡市场已经具有一定的规模,特别是近10年来的快速发展导致信用卡发卡量的激增,庞大的信用卡市场也成为不法分子的目标,信用卡欺诈风险增长迅速,欺诈手段多种多样。特别是在我国信用体系缺失还没有发挥作用的前提下,国内金融机构正面临严峻的挑战。金融机构的重点在于如何有效、快速、准确地识别出信用卡欺诈行为。本文从信用卡的申请阶段和交易阶段出发,对信用卡欺诈风险进行了分析和研究,并对信用卡欺诈检测领域的文献进行了系统的梳理,总结出在信用卡欺诈检测中面临的挑战以及已有文献的不足。信用卡欺诈数据本身具有不平衡性的特点,欺诈数据往往比正常数据少很多,已有的文献通常利用KNN分类、神经网络和支持向量机(SVM)对不平衡分类进行研究。KNN分类、神经网络都是成功的机器学习方法,被广泛应用到各个领域,然而针对信用卡欺诈这种大型数据和数据间复杂的非线性关系,这些方法面临巨大的挑战。另一种常用的分类方法是支持向量机,传统的支持向量机并不是没有任何缺点,因此本文在传统支持向量机(SVM)的基础上,综述了无核二次曲面支持向量机(QSSVM)的原理和性质,在此基础上提出模糊二范数无核二次曲面支持向量机(F2NQSSVM)来进行信用卡欺诈检测,并和KNN分类、神经网络、传统SVM作对比;最后以申请欺诈数据为例,通过对银行业人员回访获得的数据与新模型得出的结果进行比较分析,验证模型结果的有效性,为金融机构信用卡欺诈检测提供新的思路。主要工作包括:(1)提出了 F2NQSSVM模型。首先介绍了传统支持向量机的理论和其简单应用领域,并分析了 SVM模型的基本原理和相关性质。SVM模型的主要目标是找到一个最大化间隔超平面,把两类训练点尽可能的分开。在实际应用中无法找到一个超平面能够完全把所有的分类点分开,并且训练数据往往不是线性可分的。通常的做法是利用核函数把原始数据投影到高维空间.使其线性可分.但对于核函数的选择并没有通用的选择标准,并且核参数的选取直接决定了模型的预测结果。因此本文在此基础上综述了现有的无核二次曲面支持向量机(QSSVM)模型,并且针对信用卡欺诈数据的不平衡性,改进QSSVM模型,赋予欺诈数据更高的惩罚成本,并给每一个训练数据一个模糊系数,进一步提出F2NQSSVM模型。(2)建立了基于QSSVM和F2NQSSVM模型的信用卡欺诈检测模型。首先分别对申请欺诈和交易欺诈的原始数据进行预处理、特征变换和特征选择,确定模型的输入因素,然后用QSSVM模型和F2NQSSVM模型建模,并和KNN、神经网络、SVM模型作对比。最后以申请数据为例,分别以中国工商银行、光大银行、丹东银行中的从业人员为对象,对信用卡申请时特征的重要度进行问卷调查,和模型得出来的结果进行比较,分析结果的一致性和差异性,进而验证模型的实用性,并为金融机构提出合理的建议。本文得到的主要结论有:1)针对信用卡申请欺诈和交易欺诈的数据,F2NQSSVM的结果最好,评价指标F值最大,模糊方法的处理对于不平衡分类问题是有效的,能够显著提高模型的效果。因此在处理不平衡的数据时,可以考虑模糊准则的方法提高模型的分类效果,可以把F2NQSSVM模型有效的应用于信用卡欺诈检测。2)通过对信用卡申请数据的欺诈检测研究建议,模型得出的前8个重要特征中不仅要考虑申请人的房屋状况、信用保证金额、从业年限范围、申请信用卡的目的、工作技能、可支配收入占比,更要考虑申请人的信用历史记录和财产状况,因此,对于信用卡申请方面,需要我国继续建立和完善信用体系和制度,对于信用卡交易,需要及时监控大笔交易信息和频繁交易信息,及时识别出可疑的欺诈行为。以上得出的结论可以为金融机构进行信用卡欺诈检测提供借鉴和指导作用。
其他文献
上学期我们为89级化轻工工程类(含食品营养专业)的学员登载了《物理化学(一)试题及答案》,这学期继续将《物理化学(二)试题及答案》供给大家复习参考。参考时仍然要注意以新
《经义述闻》乃经学之权威,亦是王念孙、王引之父子之代表著作。二人每立一说,必言之有据,去取之间,尽见卓识。但书中亦有未尽完善之处,其中,“以孝罴罴”可读为“克谐以孝,罴罴父不
将征信文化理念融入小微企业信用理念中,并将征信文化与小微企业信用文化有机融合,可以激发小微企业自身信用财富的转化,提升征信文化软实力以解决小微企业融资难问题,促进全
汉字作为一种独立的文字系统,其区别于其他文字系统的根本特征是什么,早在五十年代就引起了文字学家们的注意,自八十年代则已成为汉字研究的热门话题.对于汉字的性质,众说纷
深圳教育云平台面向教师通过信息技术与课堂教学深度融合,一站实现备课、授课、作业等教学信息化;面向学生构建各种学习场景的信息化服务,增强现有教学设备的互动能力,提升课
经过三十年的发展,我国已经形成了比较完整的学士学位授予体系与国家、省级和学位授予单位三级学位管理体制;学士学位制度基本满足了高等教育办学类型多样化的需求,社会对毕业生
为了在产品的设计早期获得检测率、隔离率等测试性数据,提出一种应用多信号流图模型方法进行系统测试性建模与分析的方法。基于雷达等电子产品结构复杂、解析建模困难的特点,分
第一章 经济法律关系1.1988年5月,17岁的中学生甲毕业后,顶替父亲参加工作,业余时间从事服装个体销售,并与广东的乙签订了价值5000元的服装销售合同,双方商定在同年10月,由乙
目的探讨莫西沙星治疗慢性支气管炎发生急性细菌感染的效果。方法将我卫生站2007年3月至2011年10月收治的慢性支气管炎细菌感染急性发作期患者66例随机分为两组,对照组患者给
历代中央政府大都采取“安藏必先安青”的政策,所以加强公安工作,注重警察职业能力的培养,对青海藏区的稳定和发展有着重要的意义。了解青海藏区的基本情况和重要地位,认识警察职