基于机器学习的信用卡交易欺诈检测研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:zhang332974789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网快速发展的时代,信用卡以绝对的优势出现在人们的日常生活中,其持卡人数与日俱增,并不断推动经济快速发展.即便有相关法律政策的保驾护航,但是信用卡欺诈交易依旧存在,这不仅会给相关银行造成经济损失,而且会降低个人的信誉度进而影响日常生活.如何快速有效的识别欺诈交易,并及时采取相关措施制止对信用卡的健康发展至关重要,基于此本文研究建立信用卡交易欺诈检测模型.首先,通过查看和分析原始数据的缺失值和异常值,考虑到银行后台数据记录的稳定性以及不同持卡人的消费心理和需求,决定对异常值不做处理.同时,通过可视化分析,形象展示部分变量之间的关系和特点,为后面特征选择提供一定依据.另外,利用生成式对抗网络的改进算法WGAN平衡数据集,并以常用的Logistic回归模型为例验证平衡前后模型分类效果变化,发现平衡后查准率、召回率和F1值均有所提升,召回率更是提高了7.5%左右.其次,使用过滤式中的最大信息系数法、包裹式中的基于随机森林的递归特征消除法以及基于树模型的嵌入式三类方法提取主要特征指标,并用投票的方式选择出19个特征.然后基于随机森林模型对比五种情况下的分类效果,确定出最终的19个特征.然后,使用按照7:3比例划分好的训练集和测试集分别训练和测试Logistic回归和支持向量机两种单一模型以及随机森林、梯度提升树算法、XGBoost算法和LightGBM算法四种集成模型,并以F1值、召回率和AUC值等作为评价指标对比参数调优后的各模型分类效果.研究发现集成模型的分类效果普遍优于单一模型,LightGBM算法模型的分类效果最佳且运行速度最快,召回率达到0.9857,F1值为0.9892,AUC值更是达到了0.9929.最后,使用目前比较常见的SMOTE算法及其几种改进算法对数据集进行平衡处理,并用不同平衡方式得到的数据集训练LightGBM算法模型.通过对比不同情况下模型的分类效果发现,本文研究建立的信用卡交易欺诈检测模型——WGAN-LightGBM表现效果最好,不仅泛化能力强,运行速度快,其召回率、F1值等都最高.同时又分别从数据层面和特征指标层面出发验证模型的稳健性,发现该模型具有较强的稳健性.
其他文献
光孤子是光脉冲在非线性介质中传播时,色散效应与非线性效应达到平衡后形成的一种特殊的非线性局域波包。光孤子在传播中具有保持自身形状、速度及振幅不会发生变化的性质,即使是与其它光孤子彼此碰撞后仍旧保持原本性质继续传播。光孤子因其优良的特性,成为了光通信及光量子信息领域的新一研究热点。因此,在此学术论文中我们主要研究了光孤子在电磁感应透明(Electromagnetically Induced Tran
学位
<正>民航业是我国经济社会发展重要的战略产业,也是构建现代综合交通运输体系的重要组成部分。10年来,我国民航业在旅客出行智能化、便捷化程度上不断提升,交通基础设施不断完善,民航业发展跃上新台阶。“当前,我国航空市场增长潜力巨大,仍处于重要的战略机遇期,但机遇和挑战都有新的发展变化。”中国民航局发展计划司司长韩钧说,民航业正着力增强创新发展动能,加快提升容量规模和质量效率,全方位推进民航业高质量发展
期刊
奇点光学是现代光学的一个重要分支学科,主要开展具有相位奇异的波前错位和具有偏振奇异的偏振拓扑产生、传输、调控及其应用的研究。奇点光学以其独特的属性和广阔的应用前景引起了物理学各分支学科以及化学、材料科学、生物医学、声学等多个科学领域的广泛关注。产生奇异光场成为奇点光学的重要研究内容。透镜、相位板和光栅等光学器件或者干涉与衍射光学系统场常用于奇异光场的产生,但是块状的光学元件或者复杂的光学系统难以实
学位
<正>一、智慧民航建设现状智慧民航是运用人工智能、物联网、云计算、移动互联网、大数据等新一代技术,分析整合民航业各种关键信息和要素资源,在出行、物流、服务等方面进行数字化转型、智能化升级,最终实现智慧化变革的过程,是新技术与传统民航业的深度融合。智慧民航归根到底是一种行业发展新模式。智慧民航的推进往往在供给端发力,让数据、新技术等赋能基础设施、优化业务流程、催生新兴业态。而建设成果大多在需求端体现
期刊
随着当代信息技术更新速度的不断增快,基础教育也要紧跟时代的发展,运用信息化手段开展教育教学工作,进行教育改革。这也促使高中物理教师要转变时代教育理念,创新教学方式。为配合我国基础教育课程改革,推进物理课程建设,物理学科的教学目标由培养学生的知识构建向培养学生的物理学科素养和能力等方面转变,教学内容也不断更新,这些都对物理学科的教学提出了新的要求。本研究针对目前国内STSE教育缺少较为系统化的教学实
学位
双曲超材料是一种由特征尺寸远小于工作波长的结构单元所组成的人工材料。通过改变组成双曲超材料结构能实现对双曲超材料内部等离子体激元的调控。双曲超材料还支持发生在金属-介质-金属单元内的间隙等离激元,他们的相互耦合形成了波矢量更大的体等离激元(BPP),更多的间隙等离激元参与到耦合中会产生更高阶的BPP。这一高阶的BPP产生束缚在双曲超材料表面的强电磁场,有助于表面光谱的增强特别是拉曼光谱的增强。表面
学位
2017年(2020修订版)《普通高中物理课程标准》中明确指出:“遵循教育教学规律和学生身心发展规律,贴近学生的思想、学习、生活实际,充分反映学生的成长需要,促进每个学生主动地、生动活泼地发展。”而诞生于21世纪的神经科学、认知科学和教育学整合在一起的教育神经科学,为教育学发展与研究提供了生理科学证据,这就要求教育工作者应该在充分了解脑功能和脑认知规律的基础上,建立或选择适应学生认知发展规律的教学
学位
数字全息是一种通过图像传感器将全息图输入计算机、由计算机进行数字重建的复振幅成像技术。由于数字全息的定量相位成像特性,其在物理学、生物学、医学等诸多领域已得到广泛的应用。但是由于衍射极限以及成像系统的空间带宽积的限制,数字全息成像技术一直存在“大视场”和“高分辨”无法兼容的矛盾,因此提高全息成像分辨率以及扩大全息成像视场是非常有意义的研究内容。在本论文中针对大视场和多通道离轴数字全息成像方法进行了
学位
当下,国家为提高教师各方面的待遇提供了有力的政策支持,同时,也对教师提出了更高的要求。新手教师因缺乏实战经验,其教学能力距国家要求仍相差甚远。本论文期望从专家型教师和新手教师的语言对比上,找到两者之间最明显的差异并对新手教师提供针对性、可操作性的建议。本文以会话分析理论和建构主义理论为基础,使用质性研究和量化研究相结合的研究方法,分析新手教师和专家型教师在使用相同课件的情况下,语言上存在的差异。本
学位
《普通高中数学课程标准(2017年版2020年修订)》对普通高中数学教育的定位是面向大众、面向全体学生的基础教育。这就要求在教育的过程中要促进全体学生全面发展。但随着高中知识逻辑抽象程度的上升,知识结构的复杂化,很多高中生在不同程度上都表现出了一定的数学学习障碍,如认知障碍、操作困难、基础不扎实、知识体系不健全、知识结构不完善等,出现了我们称之为“学困生”的学生。对于这一类学生,教师在教育过程中需
学位