基于高维分布不均衡在线交易数据的欺诈识别

来源 :暨南大学 | 被引量 : 0次 | 上传用户:2034912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字化的今天,大量交易实现在线化,线上交易数据日益飙升,金融欺诈犯罪急剧增加,导致金融机构巨额损失。本文结合监督学习与非监督学习的优势,主要对现有反欺诈识别的三个问题进行探索。其一,正负例样本不均衡问题。基于DBSMOTE算法猜想提出GMM-SMOTE算法对正样本进行线性差值过采样。设计对比试验验证了DBSMOTE在本数据集上表现优于GMM-SMOTE。其二,样本变量偏移问题(Covariate Shift)。引入迁移学习概念,猜想验证了基于Kullback-Leibler概率密度比估计法对比机器学习确认法能更有效地解决样本变量偏移问题,使模型预测效果更优。其三,时间局限性问题。随着时间推移,诈骗手法的翻新,无监督学习异常点的识别与有监督学习反欺诈识别域有着互补的优势,本文将Cat Boost算法与孤立森林优势结合起来提高反欺诈识别领域召回率并设计了孤立森林(Isolation Forest)、混合孤立森林(Hybrid Isolation Forest)、拓展孤立森林(Extension Isolation Forest)对比实验,发现混合孤立森林算法在欺诈识别中表现更优。在特征筛选方面,除了结合常规的相关性、异常值情况进行处理还融合了时间一致性概念筛选特征,将在时间跨度上预测表现较差的变量删除。在特征新增方面,加入滑动时间窗口特征及重点分组特征。
其他文献
提出了一种针对喷嘴孔内空化现象的数值计算模型——喷嘴空化模型,并进行了可视化试验以验证其模型有效性,其中喷嘴空化模型考虑了液相与气相之间相变、气泡动力学、湍流扰动
  目的:探讨全身预防性应用抗生素对正常分娩会阴侧切术切口的影响。方法:收集昆明医科大学第一附属医院2012年全年自然分娩会阴侧切术的产妇共171例资料,全身预防性使用抗生
目的:探讨针刺改善PCPA失眠在中枢5-HT睡眠递质及5-HT亚型受体后信号通路的作用机制。方法:选取70只健康SPF级SD雄性大鼠,随机抽选16只为正常组,剩余54只进行造模并筛选,随机
目的探讨清洁间歇导尿术对脊髓损伤患者膀胱功能的影响。方法 39例脊髓损伤伴有尿潴留患者实施清洁间歇导尿术1个月,治疗前及治疗后分别测定残余尿量及进行实验室检查计算下
本届博鳌亚洲论坛上,与会嘉宾对“中国梦”多有论及。而最新一项重要调查称。有过半公众认为,实现“中国梦”有赖于缩小收入差距。如何破题?陈志武教授通过研究提出了当今社会收
硫氧化细菌(Sulfur-oxidizing bacteria,SOB)是自然界中硫生物氧化中的主导者,在整个环境中的硫元素地球化学循环起着重要作用。自然界火山环境中丰富的含硫物质是SOB的合适栖息地,但目前关于SOB多样性的研究多集中于温泉热液、一些盐碱湖及海底沉积物中,对火山区域环境的SOB多样性研究较少。研究表明,环境中微生物在全球范围内有一定地理分布格局,纬度、pH、总氮、总碳等一些环境因
由央行会同有关部委牵头、起草、制定的《关于促进互联网金融健康发展的指导意见》是互联网金融行业"基本法"。按照"鼓励创新、防范风险、趋利避害、健康发展"的总体要求,《指导
目的探讨超声刀在舌下腺及囊肿切除手术中应用的安全性及有效性。方法收集2012年8月至2014年10月舌下腺囊肿患者37例,使用超声刀完成舌下腺及囊肿切除手术,均获成功。结果 37
经济学家李佐军认为调结构已经迎来了最好的时机。如果不把调结构当回事,可能还会走上高污染、高排放、低附加值的老路
<正>~~
会议