面向欺诈的不均衡数据分类方法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:yinqing68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,信用卡支付已经成为一种流行的支付方式。然而,信用卡诈骗事件呈上升趋势,在世界范围内造成了巨大的损失。在风险防控领域,虽然传统的基于规则的风控系统还大量存在,但采用机器学习构建的系统已经开始被很多研究者开发,并越来越受到重视。信用卡交易及账单偿还数据集在数量上高度不平衡的,这在现实数据中表现为合法交易的数量远远多于欺诈交易的数量,按时进行还款的数量远远多于拖欠账单的数量,这会对风控系统的检测带来极大的影响。现有的方法主要考虑如何仅根据数据量来平衡这两个类,而不考虑信用卡交易中用户行为的复杂性,同时忽略了用户行为的联系与变化,即用户的每一次消费和偿还账单的行为都有可能受到其他相似行为潜移默化的影响。基于此,本文的主要工作如下:(1)定义了一种行为噪声并提出了一种基于行为聚类的不平衡数据降噪方法(Behavior-cluster Based Imbalanced Noise Reduction,CNR),针对不平衡数据中用户行为的复杂性,从用户行为的角度出发,通过分析相同标签的交易,总结了一些群体行为,并删除不符合行为模式的噪声样本,通过这种方法不仅完成了数据的重采样,而且保证了用户行为分布的合理性。在18个不均衡UCI公开数据集上与现有的优秀不均衡数据处理方法相比,本文提出的降噪方法的F1在13个数据集上取得了最好的结果,AUC在10个数据集取得了最好的结果,证明了降噪方法的普适性,同时在信用卡欺诈和信用卡违约数据集上均取得了F1最优的结果。(2)提出了一种降噪后基于用户行为相关性的图注意力网络分类模型(Graph Attention Network Classification Model Based on User Behavior Correlation with Noise Reduction,GAT_CNR)。GAT_CNR从用户行为的角度构造图结构通过图神经网络(GNN)来学习图中节点间的联系,丰富节点信息表征。数据分类时GAT_CNR利用注意力机制组织图中节点信息聚合以形成有效的预测特征。与现有的不均衡数据处理方法相比,基于降噪的图注意力网络方法在信用卡欺诈和信用卡违约数据集上均取得了F1最优的试验结果,证明了所提GAT_CNR的有效性。
其他文献
西夏文字作为一种记录西夏王朝历史的文字,有着极具特色的文化内涵,西夏文字的识别对于整个西夏学研究工作有着重要的意义。到目前为止,西夏文字识别率较低的问题限制着西夏学研究的发展,与广泛使用的文字例如汉字的识别研究相比较,针对古籍文献手写西夏文字符的识别研究存在更多困难,主要包括:西夏文字结构比汉字更复杂,字符笔划更多;西夏文字符类别之间相似度更高;手写西夏文字符的训练样本集受限于样本来源,存在部分字
镁或铝基合金或氢化物水解材料具有地壳储量丰富、理论产氢量高、氢气纯度高、以及水解产物对环境友好等优点,被认为是十分具有前景的制氢材料。但水解过程中形成的氢氧化镁
近年来随着人均耕地面积进一步减少,国家越来越重视“精准农业”的发展。“精准农业”不仅要求种植户做到“精准施肥”还要做到“精准播种”,具体到实际生产过程中既要清楚复合肥中营养元素的种类与含量,还要对土壤中所含养分元素种类和含量有明确的概念。精准施肥的前提是要对农作物的生长环境有充分了解,因而获取土壤中微量元素含量的分布在精准农业中起着至关重要的作用,是指导我国农作物生产的关键。目前国内对土壤中微量元
近年来,人们在生活中对抗菌材料的需求越来越多,因此新一代环保型二氧化钛抗菌陶瓷应运而生。本论文选取具有良好抗菌性的Zn/Co共掺杂TiO2纳米材料,采用超声喷雾热解法及浸渍
中远红外非线性光学晶体材料在激光医疗、环境中痕量气体的探测和分子光谱等民用领域以及激光瞄准、激光通讯、红外遥感和红外测距等军事领域中都有着相当广泛的应用。目前商
本文,我们应用时间分数阶相场模型来描述两种不可混溶的混合流,以此来解释在自然界中普遍存在的一些反常扩散现象。我们主要研究时间分数阶Allen-Cahn和Cahn-Hilliard这两类
随着互联网+、大数据等信息现代化的到来,信息数据超载(Data Overload,DO)现象已成为亟待解决的问题。推荐技术(Recommended Technology,RT)是目前有效缓解此类现象的方法之
铸锭冷却凝固过程中的界面传热非常复杂,铸模-铸锭界面上的界面换热系数是影响凝固过程的核心参数,它受到浇注温度、铸模预热温度、铸锭热物性参数和铸锭形状等多方面因素的
在过去的十年中,包括Ia型超新星(SNIa)、宇宙微波背景辐射(CMB)的温度和极化各向异性功率谱、重子声学振荡(BAO)和弱引力透镜(Weak Lensing)等在内的多种观测都表明,目前的宇
近年来的研究表明,除了原子在材料中的构成和排列外,维度在决定它们的基础性质上也起着关键的作用。这一点可从过去几年对石墨烯的研究中可以看出,它展现了出了不同于体材料的光、电性质,如:具有高的导电性和导热性。随着石墨烯的快速发展以及制备超薄层方法的日益成熟,引起了人们对二维材料(TM)的广范研究和探索。二维材料具有表面原子利用率高,能带结构易调控,可进行表面化学修饰等特点,因此具有重要的科研价值和广泛