基于GAN的电子交易负样本生成模型与方法

来源 :东华大学 | 被引量 : 0次 | 上传用户:hordark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网金融科技和移动支付的快速发展,欺诈手段与方式不断升级。机器学习与深度学习被广泛应用于电子交易欺诈检测,良好的检测结果依赖于大量样本的数据集。然而在电子交易中,正常交易量达到百万时,欺诈样本只有一千多个。并且根据统计数据发现,欺诈交易比率通常低于0.1%。在这种正负样本极度不平衡的数据集中,如何生成一致性的数据分布,解决数据集样本不均衡的问题。因此,本文从以下三个方面展开研究:
  首先,针对样本时间序列性对生成效果的影响,提出了基于长短期记忆网络的生成对抗样本方法与样本生成评估模型。该方法使用长短期记忆网络的记忆模块对稀疏的时序关系进行处理,利用生成对抗网络隐式建模数据分布,生成样本数据。并且,从纵向数据分布和横向属性相关性两个角度建立样本的一致性评估模型。在某银行真实电子交易数据的实验表明,相比其他生成模型,生成样本的一致性结果提高了10%左右,并且生成的样本数据增强了欺诈模型的检测效果。
  其次,为克服输入噪声不具任何先验信息的问题,提出了基于自动编码器的对抗样本生成方法。对输入数据使用编码器获得样本特征空间,生成器与解码器合二为一,输入生成器的噪声是包含样本特征的先验噪声信息,从而指导生成器生成样本。同时也解决了模型在对抗过程中,生成器较弱容易受随机噪声干扰的问题。通过实验表明,与原有的数据生成方法相比,该方法在生成样本一致性评估上提高约8%。同样,生成的数据在原数据集中让检测模型分类效果更佳。
  最后,设计并实现了电子交易负样本生成子系统。将构建的生成模型应用于系统层面。主要实现了两个功能:模型离线训练和样本数据生成。模型离线训练实现了对于需要解决不均衡问题的数据集,抽取数据,预处理数据,初始化模型和模型离线训练更新;样本生成模块是调用离线训练模块训练完成的数据生成部分,生成负样本数据并对结果分析。操作者可以通过这两大主要功能,可视化模型训练和数据生成流程,验证数据生成方法的可用性。
  综上,针对如何生成分布一致的样本数据问题,本文提出基于生成对抗网络的交易负样本生成方法。引入长短期记忆网络处理电子交易的时序特征,加入自动编码器网络为生成器输入提供先验噪声信息,并搭建电子交易负样本生成子系统验证模型的有效性。在欺诈交易、信用卡欺诈检测等交易领域都具有一定的应用价值。
其他文献
【摘 要】小学语文写作是小学课程的重要组成部分,写作教学的质量关系到学生的写作能力以及学生写作兴趣的培养。但在实际教学过程中,小学语文的写作教学仍然存在很多问题,导致教学效果不够理想,教学质量不佳,本文从小学语文写作教学存在的问题进行分析,并提出相对应的解决措施,以提高小学语文写作教学的质量,为学生的写作能力奠定扎实的基础。  【关键词】小学语文;写作教学;存在问题;解决对策  【中图分类号】G6
期刊
【摘 要】现在的阅读课教学,主要分为教读课文和自读课文。但是很多情况下都是由教师单篇式的精讲精练,学生被动地学习,死板地勾、画、记录教师讲授的重点、难点、考点,教师强调文道统一,只关注细化字、词、句地教学,反而忽略了学生的情感体验和自主性发挥。在这样的教学方式下,学生不能充分发挥主体地位,虽然在单篇的阅读学习上能够获得一定的知识,但是明显限制了学生的阅读量、也花费了大量的时间和精力,反而导致了教学
期刊
【摘 要】语文是解读人生、社会、生活、生命等问题的学科。它注重感悟学习和体验学习,即感悟、体验语文的文化内蕴和它所包含的文化精神,使学生在语文学习和技能训练的过程中得到情感的陶冶、心灵的建构、文化精神的内涵。在这一过程中,阅读就显得尤为重要。加强阅读教学,提高学生的阅读能力,是培养学生获得知识的有效途径,培养学生的阅读能力,是语文教师重要的教学任务和教学目标。  【关键词】小学语文;阅读教学  【
期刊
云计算市场近年来不断高速发展,云供应商不断地加入云服务市场,带来了质量更高、价格更低的云资源服务。云计算由于其能够提供几乎“无限”资源的特性,可以令个人或组织在无需构建基础设施的前提下,按照需要获取、配置和使用云资源,并按使用进行付费。不同的提供商提供了许多种类的云服务,它们有着不同的规格、不同的价格策略、不同的质量参数等。进行工作流调度时,传统计算平台难以灵活的配置需要的基础设施。因此,分布式环境下的工作流调度问题,已经从集群、网格等传统计算模式中寻求解决方案,逐渐发展到利用云计算等高效、成熟、便利的在
云存储的弹性扩展存储特性,为数据所有者远程存储数据提供了灵活的存储服务,也降低了数据所有者的存储运营和管理成本。这些远程存储在云服务提供商的存储空间中的数据,也给数据所有者带来了数据完整性方面的安全担忧,如数据的恶意损坏或删除等。数据完整性验证成为检测存储在云存储提供商空间中数据完整性的重要技术手段。然而,现有的验证方法仅考虑了一个验证者发起单个或多个数据验证挑战的情况,忽视了多个验证者在相对较短的时间内发起的多个数据验证挑战的验证开销给数据所有者带来的负担。同时,没有数据访问权限的用户对数据发起完整性验
联合学习中每个参与者不能互相沟通,训练集与外界隔离,无可信赖的权威第三方检验训练样本的真实性与正确性,所以联合学习容易受到通过污染本地训练集而影响全局模型的毒化攻击。针对传统的集中式学习的毒化攻击已经得到广泛的研究,而对联合学习的分布式毒化攻击还未得到多数研究者的关注,所以本文在实验过程中探究分布式毒化攻击对联合学习的影响,并结合欧几里得距离度量模型差距进行理论分析,最后基于对攻击的分析结果提出一种新的防御策略。
  首先,本文关注联合学习中分布式毒化攻击的影响因素对攻击效果的影响。通过对两个数据集
随着社会的发展和科技水平的提高,视频监控越来越多的出现在人们的日常生活中。利用视频进行行人的分析,传统的人工方法工作效率低下且容易出错,而人脸识别在监控的实际应用中效果非常有限。近年来,基于单个摄像头视频序列分析技术已经取得了巨大的进步,但是单个摄像头无法覆盖更大的区域,故分析视频信息需要综合多个摄像头的视频序列。因此,行人重识别方法的研究渐渐成为机器视觉领域的主要研究课题之一。
  本文提出了基于监控视频的行人重识别方法研究,首先对视频行人进行检测,对检测到的行人进行目标行人重识别,最后对识别到的
【摘 要】随着教育活动的发展变化,实现个性化阅读,对于小学语文教学具有非常积极的作用,这对于学生个性化发展和语文素养的提升,都具有积极意义。对此,本文首先分析了个性化阅读教学的内涵,然后探讨了当前教学存在的不足,最后分析了个性化教学的有效策略,以供参考。  【关键词】小学语文;阅读教学;个性化  【中图分类号】G622 【文献标识码】A  【文章编号】2095-3089(2019)24-0216-
期刊
【摘 要】近年来,一种新的阅读教学实践——群文阅读悄然兴起,并很快就风行大江南北。当群文阅读碰上数字化教学模式,又会擦出怎样的火花呢?数字化工具让群文阅读的备课与前置性作业设计如虎添翼,数字化工具让群文阅读的课堂活色生香,培养创造性思维,还可以助推群文阅读由课内走向课外,成为我们拓宽阅读渠道,拓宽眼界、提升综合素养的利器。将学生碎片化、无意识、片面追求快感的数字阅读,引领到有主题、有方向、有目标、
期刊
【摘 要】语文作为我国的一门基本学科,小学语文是学生语文教育的基础阶段也是启蒙阶段,在教育事业的改革浪潮中也得到了越来越多的重视,尤其是语文课外阅读的教学。小学语文课外阅读可以说是课堂阅读的延伸和扩展,学生们通过有效的课外阅读可以加深对课堂内容的理解,同时还能够增加学生们的知识储备,激发写作灵感,提高阅读水平和写作能力。故此,本文通过分析小学语文课外阅读的现状,探究小学语文课外阅读的策略性教学,以
期刊