在线交易欺诈的重现概念漂移检测模型与方法

来源 :东华大学 | 被引量 : 0次 | 上传用户:hanhan069
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
欺诈团伙或平台不断更新欺诈手段,在线欺诈检测模型若仅应对新欺诈概念不断进行训练,难以识别重现的旧欺诈概念;若训练全局数据,时耗巨大且存在滞后性。目前解决重现概念漂移的方法受限于模型自身结构和训练任务,缺乏普适性。反欺诈工作依然面临着严峻的挑战,针对上述问题,本文展开深入研究,主要工作有以下三点:首先,针对机器学习模型在动态增量学习时,对重现概念发生灾难性遗忘,而且数据重放方法难以提前确定重放数据量。提出了一种基于数据重放方法的增量学习模型,包括历史小类边界数据重放算法和选择合适的重放量算法。前者证明了对重放数据的选取位置从历史小类边界开始,在面对重现概念时,相同的重放量,本文提出的方法遗忘率更低。后者在无先验知识的情况下,通过模糊重放序列,能提前刻画重放数据量的范围且保证较低的重放次数。实验表明,此模型可以有效降低分类器对重现概念的遗忘率;同时,不仅不影响新任务的学习,而且不受具体分类器的限制。然后,在线交易欺诈手段呈现日新月异的变化趋势,导致传统欺诈检测模型分类精度下降,无法保证模型的泛化能力。解决此问题重点在于使得分类器能同时适应新旧欺诈概念,充分学习足够多的欺诈特征。提出了在线交易中检测欺诈概念的数据重放方法,以分类器性能变化确定概念漂移时刻,对比重放欺诈概念数据后的数据分布与当前已知的数据分布之间的余弦相似度确定重放数据量,尽可能多的保留出现过的欺诈概念的数据分布;并且利用聚类过采样方法平衡数据集,解决类内不平衡问题。实验表明,利用单个分类器能适应突变型和重现型概念漂移,具有更高的平均准确率,更低的重放数据量和模型更新时间。最后,设计并实现了欺诈概念漂移检测子系统。系统中对国内某商业银行B2C信用卡交易数据进行数据流的批处理后,进行欺诈概念漂移检测。通过重放数据对样例池进行更新和维护,进而对欺诈检测分类器进行更新,可视化概念漂移点,以及重放数据前后的系统指标变化,对交易数据进行拦截或放行。该系统不仅可检测重现欺诈交易,还可以帮助风控人员进行重现欺诈手段分析。综上,在交易数据流中发生重现概念漂移的背景下,如何使得欺诈检测分类器在适应新欺诈概念的同时,又能保证对历史欺诈概念的记忆,针对此问题,本文从重放数据的角度,提出了基于数据重放方法的增量学习模型和在线交易中检测欺诈概念漂移的数据重放方法,设计并实现了欺诈概念漂移检测子系统。经过实验和系统验证,本文提出的模型在在线交易欺诈的重现概念漂移检测领域具有重要的理论价值和应用价值。
其他文献
知识图谱是一种重要的存储结构化数据的技术,它可以为多种信息化应用提供知识支持,例如推荐系统、问答系统等。知识图谱自动构建技术的研究在通用文本上开展的如火如荼,而在特定领域上则鲜有人问津。但对于医学、经济、军事等领域,专业的知识图谱是推动其领域信息化发展的关键因素。特定领域的标注文本往往是稀疏的,因此,本文立足于样本稀疏领域这一出发点,对知识图谱自动构建的问题展开研究。知识图谱中结构化知识的一个重要
学位
我国海岸线较长,海上交通制约因素较多且面临日益复杂的政治环境。且我国海上观测资源有限,在这种情况下如何利用有限的不同种类资源,共同解决海上目标搜索问题,对于解决海上搜救、灾害预警、加强我国海上执法能力等许多现实问题都具有重大意义。本文首先对海上目标搜索的问题特点进行分析,然后对各种观测平台的能力、使用约束、适用情况都进行了分析。不同平台都有各自的特点和使用约束,在海上目标搜索问题中扮演了不同的角色
学位
学位
随着全球经济的快速发展,纺织服装行业市场的并驱争先日渐激烈,用户对服装需求的日趋多样化使服装订单的生产要求也随之提升。纺织服装工业互联网平台汇聚了供应链上游众多相同或相近生产能力的服装企业,所接服装订单数量庞大。传统的方式是根据经验对订单进行安排,但这种人工分配方法效率低下,且无法保证分配结果是否能最大化平台利益,因此,如何通过科学手段对这些订单进行合理分配是目前平台面临的一大难题和挑战。目前对于
学位
在近些年人工智能的研究热潮中,深度学习作为其领域下的重要研究方向得到了学术界和工业界的高度关注,并在算法、理论和应用等方面取得了丰富成果。而随着深度学习与业界融合的深入以及相关从事人员的增多,深度学习应用程序和软件系统的研发将会越来越规范化和自动化,如何使用传统软件工程的理论和实践引导这一过程也成为研究热点。相比传统软件,深度学习程序软件对数据有更强的依赖性,当环境中数据的统计属性变化或类别增加时
学位
中药多糖具有抗感染、抗氧化、免疫调节等多种活性,其优势在于毒副作用小、安全性高、功能多样。多糖通过炎症反应通路、神经递质通路、HPA轴、信号转导通路等途径可抑制抑郁症的发病进程。本文还总结分析了中药多糖目前存在问题和下一步研究重点,以期为抑郁症治疗靶点与机制、中药多糖有效成分研究与开发提供科学依据和新思路。
期刊
未来的信息化战争,不再是单纯的机械与火力对抗,而是需要充分利用一切信息资源的信火一体作战形式。谁拥有更强大的电磁情报分析能力,谁就能在战场上获得主动。尤其是在战争状态下,通过侦察敌方的电磁信号来预测分析敌方装备,进而分析其背后所隐藏的作战意图,从而辅助指挥员迅速决策,具有极其重要的战略意义。但随着信息技术的发展,电磁情报所搜集到的电磁信号数据在不断地增长,基于领域专家的电磁情报分析在面对海量数据时
学位
抑郁症已成为严重的全球健康问题。以化学药物为主的临床治疗方案呈现出不同程度的不良反应和耐药性。植物多糖来源丰富,是研究最广泛的一种多糖类物质,具有抗氧化、抗肿瘤、抗炎、抗衰老、抗抑郁等多种生物活性。植物多糖可以通过调节神经递质及其受体表达、炎症反应、下丘脑–垂体–肾上腺轴、神经营养因子、抗氧化应激损伤以及调节色氨酸代谢、肠道菌群发挥抗抑郁作用。植物多糖结构与抗抑郁功效关系的大多数研究仅仅停留在描述
期刊
在制造业快速发展的时代背景下,工业互联网作为一种将工业系统与新一代互联网技术深度融合的新型应用模式,正在推动着全球工业体系的智能化变革。数字孪生是工业互联网蓬勃发展不可缺少的技术支撑之一,能够实现对生产过程的监控。目前,数字孪生被广泛应用于各行业领域中。行为分析是评价产线运行情况的工具,它能够在产品投入制造前评估产线的性能并分析产线的运行情况,提高生产线的智能性、主动性和预测性。然而,目前的数字孪
学位
可达性查询是图数据处理中的一个基本操作,在现实生活中有着广泛的应用。给定有向图中的一个源顶点u和一个目标顶点v,传统的可达性查询用于回答是否存在一条路径,使得顶点u能够到达顶点v。实际应用中,图的边上可能会标注特定信息,同时节点之间的联系路径也有长短之分,用户通常需要查询的是能满足标签约束和长度约束的结果(LCKR查询)。LCKR查询在社交网络、金融网络、知识图谱中有着广泛的应用,但现有算法无法处
学位