基于倾斜随机森林的交易欺诈检测模型与算法研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:usaend
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年互联网技术的快速发展,在线交易业务爆发式增长。如今,第三方支付服务交易方式已成为当前最重要的支付方式之一。交易订单的增多与交易金额的大幅提升,随之而来的在线交易欺诈行为时有发生,这给交易平台与个人用户造成了严重的损失。因此,如何有效地识别交易欺诈行为,成为了亟待解决的问题。随着数据挖掘与机器学习相关技术的发展,将该技术应用于欺诈交易识别已经成为相关领域的研究趋势。逻辑回归、支持向量机和神经网络等算法被越来越多的应用到交易欺诈检测的领域。然而,欺诈交易数据具有类别分布高度不平衡的特点。欺诈交易与正常交易相比数量非常少,并且一些欺诈交易与正常交易行为的差异不大。这使得数据挖掘技术中传统的分类器难以从海量的正常交易样本中分类出少数异常的欺诈交易。针对上述问题,本文提出了基于倾斜随机森林的交易欺诈检测模型,并根据模型设计了TFDORF算法(Transaction Fraud Detection Algorithm Based on Oblique Random Forests)。本文从如下两个关键点进行研究:1.交易欺诈检测模型与算法研究。针对交易欺诈检测存在交易数据纬度高、样本类不平衡的角度考虑,本文提出了基于倾斜随机森林的交易欺诈检测模型。交易数据在训练分类器之前,需要对主要特征进行筛选,以及对不平衡数据进行处理。采用倾斜随机森立作为欺诈检测分类器,并设计欺诈识别方法。针对基于倾斜随机森林的交易欺诈检测模型,本文设计了TFDORF算法,最终达到交易欺诈检测的目的。2.不平衡数据处理与分类器构建研究。针对不平衡数据处理问题,本文采用基于KMeans聚类的邻域清理方法。根据欠采样的思想,将冗余的正常交易元组删除,以此平衡样本类分布。本文在随机森林的基础上进行改进,提出了基于逻辑回归的倾斜随机森林作为交易欺诈检测的分类器。使用逻辑回归决策边界替代决策树单个属性分裂准则,使得分类器可以更好的适应数据的空间结构,有效地提高了随机森林对欺诈交易行为的识别率。并根据倾斜随机森林设计了欺诈交易识别方法。本文选择了kaggle中Fraud Detection数据集进行实验测试。采用了TPR、FPR、F1-score等分类指标来衡量TFDORF算法对欺诈行为的识别效果。结果表明,TFDORF算法可以有效地应用于交易欺诈检测中。与传统算法相比可以看出,TFDORF算法对交易欺诈检测的综合预测能力有显著的提升。
其他文献
A公司作为W市国资委管理的市属大型城投类国有企业,虽然企业经营良好、发展前景优良,但薪酬管理体系一直是被干部职工诟病最多的工作,特别是近两年,这一问题越加突出,一定程度上阻碍了公司进一步发展的步伐。因此,优化改善A公司薪酬管理体系,是企业管理者急需解决的重点问题。本文结合组织扁平化、战略性薪酬、宽带薪酬、综合激励等各种相关理论,围绕优化提升A公司薪酬管理体系这一主题进行分析研究。在问题分析阶段,主
土壤重金属污染已在世界范围内被视为最难治理的环境问题之一。其中,砷(As)和铅(Pb)是我国土壤污染中较为普遍的两种(类)重金属元素。近几十年来,我国农业和畜牧业得到快速发展,每年产生大量的农业和畜牧业有机废弃物。这些废弃物如若处置不当,必然会产生一系列生态环境以及食品安全方面的问题。通过高温热解的方式将农林废弃物制成生物质炭,不仅可以实现废弃物资源化利用,还可降低其对环境的潜在危害。生物质炭作为
本文根据农村生活污水的污染现状,开展了电化学强化人工湿地处理农村生活污水的效能研究,构建了复合潜流人工湿地、两种不同基质的电解-潜流人工湿地装置和电解-复合潜流组合潜流人工湿地,探究了不同系统对农村生活污水中主要污染物的去除效果,基质的全磷含量及磷的形态,复合系统中各级湿地中的微生物群落结构及其多样性。研究的主要结果如下:复合潜流人工湿地系统对农村生活污水中的氮和COD具有良好的去除效果,而磷的处
严重事故下,核电厂燃料包壳上发生的锆水反应会产生大量的氢气,并随事故破口排放到安全壳大气环境中,造成氢气燃爆风险。在各国核电厂现有的氢气控制方法中,氢气复合器具有非能动性、低启动阈值和易于安装等优点,是主要的氢气控制方法之一。氢气复合器通过催化反应消除氢气,同时产生热量,产生自然循环流动来持续消氢,达到降低氢气风险的目的。然而,在初始氢气浓度较高的条件下,氢气复合器的放热作用使得自身成为点火源,从
重力式挡土墙是铁路与公路工程中常用的一种支挡结构。实震调查发现,在地震多发地带,重力式挡土墙由于地震作用经常产生滑移、倾覆、墙身开裂以及地基失稳等多种类型的震害。其中,由于地基承载力不足所引起的地基过大变形甚至失稳常先于墙身震害发生,是挡土墙抗震性能的薄弱环节之一。为研究地震作用下挡土墙地基承载力的变化规律,采用极限分析上限定理对地震作用下挡土墙地基极限承载力进行了推导计算,分析了极限承载力的变化
现场音乐演出是指在音乐演出过程中音乐创作者、音乐表演者和观众处于同一时间、同一空间的一种音乐演出,其通过音乐、歌唱和现场表演的形式向人们传达音乐人对世界的理解以及情感。近年来,随着人民生活水平的提高,政府政策、粉丝经济等因素对音乐产业的促进,现场音乐演出变得“流行起来”,正影响着人们的生活与生产。本研究基于秀动网网站上获取的2017年中国现场音乐演出的数据,利用SPSS、ArcGIS、Excel软
BFRP筋属于轻质高强、耐腐性较好的高性能材料,可以代替传统锚杆用于岩土加固,有效地解决了传统钢筋锚杆耐久性较差的问题,有着较大的发展空间。本文在前人的研究基础上,针对川西崩坡积混合土开展了4组BFRP锚杆和2组钢筋锚杆的蠕变试验,通过改变试验锚杆灌浆体材料和直径进行对比分析,研究了不同类型锚杆的长期抗拔力和蠕变本构模型。试验结果表明:锚杆发生初始蠕变时的荷载为40%的极限拉拔力,破坏荷载为极限拉
近年来,伴随着建筑市场的开放,资本大量涌入建筑行业,众多民营企业加入市场竞争,原有的市场经营环境被打破,使得国有建筑工程公司的竞争优势急剧减少。与此同时,业主单位对工程完工时间和工程质量的要求越来越高,工程垫资、压价的现象屡见不鲜,导致现行的建筑工程项目绩效管理模式难以适应日益激烈的市场竞争,生存压力迫使企业进行管理体制改革。在此背景下,国有建筑工程公司如何提高企业的效益并进一步发展、扩大企业规模
为支撑我国城镇化发展需求,市郊铁路逐渐成为一线大城市解决交通联结问题、承接溢出资源、疏导中心城市压力的科学选择,也深刻影响着都市圈内人们的职住模式。但是,随着交通需求的稳步增长,一系列问题开始凸显:市郊铁路通勤通学特征明显,早晚高峰客流方向集中、直达比重较大,导致高峰运力紧张而非高峰运力虚糜。高峰客流拥挤不仅严重降低客运服务水平,而且容易引发客流安全问题;而非高峰客流量不足导致运能浪费、运营效益低
地震灾害的频繁发生,严重威胁着人类的生存和经济发展。被广泛运用在地震灾害多发的港口、码头以及货运站场上的门式起重机一旦在地震载荷下发生破坏甚至倒塌将会给人们带来巨大的生命和财产损失。目前,针对结构的抗震及减震研究在土木工程方面已经得到了较大的发展。但是针对起重机的抗震及减震研究基本处于滞后状态。因此,本文针对传统结构抗震设计方法中存在计算精度低和计算量大的缺陷以及提高结构整体抗震性能为目标,对某大