随机集成学习算法设计与信用卡欺诈检测

来源 :云南财经大学 | 被引量 : 0次 | 上传用户:ggep123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技发展、网络行为普及,电子支付逐渐成为了人们日常生活中最密切的网络行为之一。而在支付方式的网络化为人们带来便利的同时,也增加了产生欺诈交易的风险。虽然信用卡欺诈行为仅占信用卡交易总量极少一部分,但仍会给银行造成巨大的损失。倘若不加以控制,信用卡欺诈还会使投资者丧失对金融体系的信心,产生挤兑现象。最终甚至会威胁到国家整个金融系统的安全,提高国家系统性风险。因此,信用卡欺诈识别工作在整个信用卡交易系统中显得十分重要。信用卡欺诈通常指通过非法使用他人的信用卡、从他人的信用卡中窃取信息进行一些非授权的购买行为、或从他人的银行账户中窃取钱财等行为。目前打击欺诈行为主要有两种方式——欺诈预防和欺诈识别,并且发展了与之配套了两套系统——欺诈预防系统和欺诈检测系统。其中欺诈检测系统分为了基于规则的系统和基于大数据技术的系统,基于规则的系统是由专家根据过去的交易记录总结经验,设定规则,存在明显的滞后性,并且规则的存储量大也不易更新。因此基于大数据技术的欺诈检测系统受到了银行的青睐。本文以公开信用卡交易数据集为研究对象,分析了信用卡数据集的特征以及不平衡数据集建模可能产生的问题和产生问题的原因。在随机集成框架下设计深度学习算法,提出了随机集成神经网络模型并在该信用卡数据集上进行了实证分析,验证了模型的有效性。得到的具体研究结论如下:首先,对信用卡交易数据集本身进行分析,通过特征的分布图和特征间的关系图分析了不平衡的信用卡数据集对建模产生的问题及原因。研究发现,机器学习、深度学习模型的良好分类性能依赖于特征分布拟合曲线的分离趋势,即这类特征拥有较大的特征贡献度,但由于不平衡数据集中两种类型数据样本量差距过大,即使曲线趋势不同,但大类型数据仍能完全覆盖小类型数据,从而在建模时,模型无法学习两类交易的有效特征。然后,本文基于Borderline-SMOTE上采样方法使用不同的采样比例下填充数据集,并且分析了它的特征贡献度和特征间关系示意图。研究发现,上采样方法能够使特征贡献度产生集中化现象,削弱次要特征的贡献度。并且在不改变特征分布拟合曲线的趋势方向的前提下,采样能够增加特征分布的分离程度,从而提高了数据集本身的可学习型。并且随着采样比例的增加,这种分离程度会得到强化。在分析采样方法之后,本文选择了多个对比模型和实验模型对原始数据集和三个不同采样比例的采样数据集进行了实证建模分析。研究结果表明,随着采样比例的增加,数据集中的样本分布能够有效影响模型的整体偏好。本文提出的模型基于不同的子网络结构分别在识别欺诈交易和模型的综合识别性能上达到了最优效果。且基于最小化损失函数优化条件的大数据模型易受到训练集样本分布的影响,树形结构的模型对样本的不平衡性敏感度较低。但基于误差训练的模型可以达到较高的识别欺诈交易的能力。此外,选择模型时还应根据数据集的分类难度选择合适的模型。在面对信用卡交易数据这类高度重叠的数据集时,线性支持向量机和逻辑斯蒂回归受制于自身模型的算力,采样比例增加则仅会改变模型的整体偏好,并不能促进模型进一步对欺诈交易进行有效的学习。最后,针对发卡行提出了组合模型的检测新思路,结合随机集成神经网络高准度和随机森林模型的高精度相结合,即首先使用随机集成神经网络预测出疑似欺诈交易的样本,再由随机森林进行筛选删去那些FP的样本,最终保留下的样本进入下一人工审核阶段,这样可以大幅降低人力成本。
其他文献
税务绩效管理信息化符合服务国家治理体系和治理能力现代化的时代要求。党的二十大报告全面回顾和审视了以往法治政府建设成果,并将这一工作任务作为今后治国的主体工程,其核心在于政府职责和职能体系向着更面向未来、更符合国家振兴要求的方向进行转变和优化,同时也在持续强调组织结构层面的架构升级和细节修正,推进各方面法定化发展步伐,包括机构、权限、责任等领域,有效增强行政效能。我国对税务系统对信息化已经开展了多年
学位
我国从2019年6月1日开始正式施行《公务员职务与职级并行规定》,其主要目的在于为公务员提供更为广阔的晋升发展空间,提高公务员工作积极性,建设一支高效廉洁的公务员队伍。K市税务系统严格落实这一《规定》,成效显著,可是仍然不可避免地存在部分问题,因此需要对于职务与职级并行制度的实际落实效果进行分析论证。在本文当中以公共管理的相关理论作为指导,应用文献综述法、实地调查法以及个案分析法等,选择K市税务系
学位
信用风险,是指交易对方不履行到期债务的风险。借款人和证券发行人或交易对方因种种原因,无法履行合同条件而构成违约的情况。贷款业务的应用较为广泛,例如银行的表内表外业务等等,信用风险直接或者间接影响着现代社会经济生活的各个方面,从微观层面上看,信用风险会影响公司信用评级状况以及经营情况;从宏观层面上看,信用风险会影响着国家的宏观经济发展状况,金融行业信用风险管理体系的完善会直接关系到金融企业的经营能否
学位
党的十九大提出“建立全面规范透明、标准科学、约束有力的预算制度。”预算信息公开是政务公开的重中之重,预算信息关乎社会经济发展与民生领域的重点项目,一直以来备受社会各界关注。财政预算信息公开保障了公民的知情权和监督权,公开过程接受公众监督,提升了公众参与程度,体现了民主原则,凸显出预算信息公开的社会效应。随着财政预算管理体制改革的深化,持续推动财政预算信息公开不仅是实现国家治理体系和治理能力现代化的
学位
近年来,西双版纳州大力实施“旅游强州”战略,全州旅游行业发展势头强劲,在全州国民经济和社会发展中的地位和作用不断提升,旅游产业也实现了从“兴州产业型”向“强州产业型”的转变。日益火热的旅游市场极大的推动了旅游行业收入的高增长,但旅游业的增值税收入并未能实现与旅游收入的同步增长,增值税征管中存在的登记注册不全、申报收入不准、政府数据增值成效差、税收风险监控漏洞等问题日益凸显。2020年新冠肺炎疫情发
学位
长期以来,我国股票市场股价波动幅度较大、频率较高的现象比较明显,其产生的原因与市场弱有效性、散户投资者相对较多、噪声交易、信息不对称等因素有关。随着“互联网+”的发展,股票投资者获取信息的能力和效率大幅提升,且获取信息的来源渠道大大拓宽了。但是,当投资者面对由新媒体检索出的热点新闻时,往往会出现投资者的过度反应现象,这在一定程度上会导致股票价格在短时间内波动性加大,例如2022年底的芒果超媒事件。
学位
中国自2001年加入WTO后,金融开放程度不断提高,外商投资环境改善,外商直接投资企业为我国带来了资本、先进技术和管理经验,促进经济总量快速增长,但对经济高质量发展影响不能确定。本文首先梳理并归纳外商直接投资与经济高质量发展的相关文献,然后以经济金融理论为基础对影响机制进行分析;其次基于粤港澳大湾区2001-2020年相关数据,从经济发展、金融发展和外商直接投资维度进行现状分析。然后从富有效率、稳
学位
对于一个大国经济而言,实体企业是立国之本、是国民经济的根基。改革开放以来,我国实体经济飞速发展,诸多重点领域的发展水平不断提升,取得了一系列重大成就。然而近年来,由于实体经济与虚拟经济之间的互动机制不健全、传导路径不通畅,大量资金在金融体系内自我循环甚至空转,社会资本“弃实投虚”的现象日益明显。宏观上表现为经济金融化倾向,微观上表现为行业、企业的金融化的趋势。金融、房地产等行业的膨胀导致的金融投资
学位
“十二五”以来,我国经济快速发展,产业结构不断优化,城乡居民收入相对差距不断缩小,但是绝对差距却在不断增大。如何有效提高农民收入、优化农民收入结构成为解决当下“农业”、“农村”和“农民”问题的关键,在此后的几年中,不同文件均在助推“三农”发展议题上提出不同远景展望,坚持把解决好“三农”问题放在首位,在解决好“三农”问题之余,全面推进乡村振兴,举全党全社会之力让广大农民过上更加美好的生活。在此背景下
学位
在当前经济日益全球化与自由化的趋势下,经济增长、金融科技发展等为金融市场的发展迎来了新机遇,使得各国金融市场之间的联系逐渐加强,促进了国际间各市场经济发展。同时,随着全球过快的通货膨胀以及一些隐性债务等问题的出现,各个金融市场存在的风险具有一定的复杂性,金融风险随着资本在各个市场之间的流入流出在各国金融市场之间进行传染。根据2007年美国次贷危机以及2009年欧债危机等极端风险事件的爆发以及危机事
学位