基于时序不均衡数据的在线交易欺诈检测研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jtls
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于近几年计算机处理能力的提升和数据科学的进步,推动了互联网的快速发展,以第三方支付服务为代表的在线交易模式已成为人们主流的消费方式之一,每时每刻来自互联网各个角落的人们通过这种基于网络的在线交易平台进行着成千上万的交易。而随着在线交易支付订单规模扩大和总交易金额的大幅度提升,各种类型的在线交易欺诈行为也越来越普遍。在线交易风险管理一直以来是业界十分关注的问题,而作为风险管理的重要组成部分,研究在线交易风险识别具有十分重要的现实意义。在线交易欺诈行为有发生频次低、造成危害大等特征,一般的反欺诈手段难以进行有效的识别并加以防范,随着机器学习与数据挖掘相关技术趋于成熟,将其应用于在线交易风险识别已成为近几年相关领域的研究趋势。在有关在线交易风险识别的研究中,其主要的难点有两个方面:首先是欺诈行为只占所有交易行为的很小一部分,数据类别分布存在高度的不均衡性,其不均衡比例甚至可达万分之一,而且部分欺诈类样本与正常样本的特征信息存在高度的相似性,使得普通的分类方法难以有效识别这类欺诈行为,因此需要利用不均衡数据分类的方法来对其进行有效的识别检测。其次,欺诈行为是具有时效性的,由于欺诈平台或者是欺诈团伙为了应对反欺诈措施会不断更改其作案方式,因此造成分类器无法适应新的特征规则,进而导致其无法对欺诈行为进行有效识别,即概念漂移现象。针对在线交易欺诈检测中的类别不均衡分布以及数据流概念漂移两个主要问题,本文在结合前人研究成果的基础上,提出了基于XGBoost和SMOTE技术的改进算法M-XGB-SMOTE,其核心思想是结合XGBoost算法较强的二分类能力和SMOTE泛化能力强的优点,以AUROC评估分数为指标从多轮重采样训练分类器中筛选分类器,并基于上述分类器构建集成分类结果的预测模型,以期提升模型预测的综合性能。在以上算法构建的基础上,提出了基于历史样本抽样递减规律的算法MS-XGB-SMOTE,以期利用历史样本随时间推移重要性递减的规律减少模型受到数据流概念漂移带来的负面影响。在基于交易风险识别数据集的实验环节中,与传统的分类算法比较中可以看出,M-XGB-SMOTE的AUC综合指标显著高于其他算法的结果;在与传统不均衡数据流分类算法的比较中可以看出,MS-XGBSMOTE算法的综合预测能力有明显提升。
其他文献
<正>在刚刚过去的达沃斯论坛上,中国总理李克强在致辞中说,"2014年,中国的经济增长7.4%,由高速增长变为中高速增长,发展必须由中低端水平迈向中高端水平。"在全球科技革命的
长期以来,我国学者一直都比较偏重于应收账款的研究,对应付账款的研究相对比较缺乏,也得不到企业管理者足够的重视。基于此,本文以成本和风险控制为视角,对应付账款管理方法
"秦派二胡"经过五十多年的发展、累积、创新,具备了陕西地域的特点,反映了陕西的人文文化。在新的世纪,为取得新的进展,出现了一批致力于发展"秦派二胡"的大师,例如鲁日融、
阐述了住宅产业化设计的概念,指出住宅产业化设计是房地产业发展到一定阶段的必然选择,从设计理念集约化、设计产品标准化、设计管理规范化和实践研发一体化四个层面对其进行
烷基二酚醚二磺酸盐表面活性剂可以很好地和漂白剂次氯酸钠混合 ,在含次氯酸钠的配方中 ,稳定性和溶解性均很好 ,不会促使漂白剂分解。
<正>据统计,全球的药品包装机械需求正以每年5.3%的速度增长,2005年的需求额已达290亿美元。如此大的包装机械市场为世界范围内的包装机械生产商们提供了广阔的发展空间。
由于具有潜在的医药价值,金属有机化合物正广泛研究中。特别是具有独特生理活性的有机金属钌化合物。本论文采用苯甲醛和4-甲基-3-硫代氨基脲反应制备L1,将L1作为配体与[Ru(p
<正>新课程标准提出,课程评价的目的一方面是为了考查学生完成学业的情况;另一方面是为了检验和改进学生的学习和教师的教学,完善教学过程,促进学生的发展。如何评价学生,使
阐述了中国家具设计的现状,通过对当代其他民族家具设计的分析,提出面对未来中国家具设计的思考,指出中国家具设计只有植根于中国传统文化,让民族化得到充分的发挥,才能在真