基于对抗网络的无监督领域自适应算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:wangjian_heu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度神经网络的发展,有监督深度学习在有大量标记数据的领域已经可以取得不错的效果。但实际上很多领域只有大量未标记的数据,对大量数据进行人工标注不仅耗时耗力、成本昂贵,而且标注质量直接关系到模型的效果。如何利用大量无标记数据训练模型,成为了深度学习发展的一个重要问题,领域自适应方法就是解决这一问题的一种有效方法。目前,基于对抗网络的领域自适应方法取得了较好的效果。这类方法借鉴生成对抗网络的训练思想,通过对抗训练的方式优化领域分类损失,对源域和目标域的特征分布进行对齐;通过降低两个领域特征表示的分布差异,使采用源域数据训练的模型可以应用在目标域数据上。现有的领域自适应方法是在域适应后的特征上进行模型训练,没有充分利用目标域数据的原始信息,当两个领域的数据分布差异较大时,目标域数据的关键信息在域适应过程中会因为特征对齐而出现损失,降低目标域特征的域内可鉴别性。针对现有方法的不足,本文基于对抗网络的领域自适应方法,在优化对抗训练的过程、提高目标域数据特征的可鉴别性上做出改进,并通过集成学习提升模型的效果。(1)提升目标域数据特征的可鉴别性。通过聚类获得目标域数据的伪标记,并利用带伪标记的数据在领域自适应中通过有监督学习的方式约束目标域特征编码器训练。通过利用目标域数据的原始分布信息,提高目标域特征的可鉴别性。(2)集成学习。对聚类得到的伪标记数据进行标记校正,并根据校正样本训练分类器。利用聚类结果训练的分类器和领域自适应训练的分类器进行集成学习,选出高置信度的样本继续训练模型并进行迭代,提升模型的最终效果。用聚类结果训练的分类器不会出现特征对齐过程中的特征损失,聚类与域适应训练的两个分类器具有更好的多样性,有利于集成学习。最后,本文在领域自适应的4个标准数据集上进行了实验,并与目前几种先进的领域自适应方法进行了对比,结果表明本文提出的改进方法实验结果好于其他对比方法。通过对结果的可视化分析,证明本文在特征对齐效果和目标域特征可鉴别性上均有提高。
其他文献
超分子化学是化学理论的研究热点,超分子体系在材料科学、环境科学和生命科学等领域中都具有非常大的应用前景。非共价相互作用则是对超分子体系进行化学研究的关键所在,超分子体系中的非共价相互作用主要包括氢键、π-π相互作用、范德华力等。本文对以下的超分子体系中的非共价相互作用进行理论计算研究:(1)分子内氢键,π-π堆积相互作用以及取代基效应对8-羟基喹啉衍生物超分子结构影响的理论研究8-羟基喹啉(8-H
目的:研究扶正通痹方对缓解期类风湿关节炎(Rheumatoid Arthritis,RA)患者的影响,进一步深刻认识其作用机理、降低西药不良反应以及延缓复发情况,为中西医结合治疗RA提供新的
近年来,将活性蛋白质载入靶细胞中释放,治疗因蛋白质异常而导致的疾病越来越受到关注,同时基因治疗作为疾病治疗的新技术,也逐渐受到重视。铜锌超氧化物歧化酶(Cu,Zn superox
品牌资产从上世纪八十年代起日益成为市场营销领域的热点话题。这一概念如今作为企业重要的无形资产,已经成为衡量品牌力量的有效工具。管理品牌资产不仅在于提升品牌形象,更是深化品牌与消费者的关系,从而帮助品牌提高市场竞争力,实现可持续发展。在上述背景下,本论文以惠氏营养品的品牌资产为研究对象,深入分析了惠氏营养品在华品牌资产管理过程中的成功与不足,并提出具体的品牌资产提升策略,为企业和顾客创造价值。惠氏营
“量”对于人类生活并不陌生,它是人们认识生活,描述生活的一种客观方式,人类语言可以通过多种体现手段让“量”得以表达出来。“量”还是一个比较笼统的概念,它可以细分到很多不同的领域,就像事物数量的量,时间长短的量,运动变化的量,这些都下辖于“量”的范畴。李宇明先生根据目前已有的认识将“量”分为了物量、时间量、空间量、动作量、级次量和语势。物量就是人们常说的对物体数量的一种计量,即事物数量上的量,主要可
作为轻质金属材料,镁合金拥有优异的物理和化学性能,其低的密度、高强度及良好的生物降解性,在汽车工业、轻型设备、电子产品、生物医学等领域得到广泛应用。然而,镁合金普遍存在的耐腐蚀性差问题,使其应用受到限制。目前,镁合金耐蚀性的改善途径除提高合金纯度和热处理外,表面改性也是一种有效的方法。常用的镁合金表面处理方法包括化学镀、化学转化、离子注入、阳极氧化、微弧氧化(MAO)、气相沉积等。其中MAO涂层在
南四湖作为南水北调东线输水工程中最大的调蓄湖库和京杭大运河的重要航段,对我国的南水北调工程的水安全及区域社会经济发展和生态文明建设均具有重要的战略意义。然而,随着
异育银鲫(Carassius auratus gibelio)因具有个头大、生长快、肉质鲜美、营养丰富等优点而受到人民群众的喜爱,其产量持续增长,带来了巨大的经济效益和社会效益。然而,大规模
1980年代以来,学界对麦克卢汉的关注度越来越高,尤其他的媒介理论在中国学界引起一时轰动,在国内研究者的共同努力下,日渐揭开麦克卢汉媒介理论的神秘面纱,发现它在国内传播学界和文学领域的研究成果颇为丰厚,也催生了许多新的理论研究点,至今关于麦克卢汉的媒介理论仍有极大的发展空间。但在现有的研究中,大多数都忽略了“媒介即讯息”理论在中国文学理论语境中的发展问题,同时缺乏梳理“媒介即讯息”理论在国内的发展
2014年以来,随着市场监管政策不断调整优化,资本市场整体并购金额、数量以及重组规模迅速扩大,然而一些新情况、新问题也随之成为了监管机构、市场研究者以及投资者高度关注的焦点,特别是对轻资产行业企业的并购,以“高估值、高业绩承诺、高商誉”为代表的“三高”现象突出,且出现了业绩承诺完成率低、承诺期过后业绩开始出现大幅下滑、频繁出现大额商誉减值的情况,甚至有些公司通过各种方式更改承诺以谋求逃避责任,远远