基于Drop-Out正则化的无监督与半监督域适应方法的研究

来源 :南京信息工程大学 | 被引量 : 2次 | 上传用户:liongliong494
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
域自适应学习是当前机器学习和模式识别领域一个研究热点,随着深度学习研究的不断进步,人工手选特征的时代即将结束。深度学习可以以最佳的方式自动从原始数据中提取到具有代表性的特征,更能有效地应用到不同的域自适应任务中。现有的基于深度学习的域自适应方法旨在通过将标签丰富的源域和无标签的目标域的实例映射到同一个特征空间中,来减少不同域之间数据概率分布的差异性。然而,这些方法并没有考虑到目标域内处于类边界(不同类别数据的分类边界)的数据,导致在类边界附近产生模糊的目标域特征,阻碍了分类精度的提升。并且,这些方法大多数时候是对源域和目标域的全局图像进行对齐,没有意识到在图像的域自适应过程中,不是所有的区域都对域自适应任务有积极的作用,强行对齐无效的区域如背景、噪声等,会导致负迁移。因此,“模型怎么才能高效地区分处于分类边界的目标域数据?”“如何抑制域自适应过程中图像无效区域的干扰,突出有效区域?”成为当下考虑的主要问题。受对抗训练和注意力机制的启发,针对以上的问题,本文分别从半监督和无监督的角度出发,提出了利用Dropout正则化的方法产生一个能够检测处于类边界附近的目标域数据的判别器,鼓励生成器为目标域生成更有区分性的目标域特征。另外,为了抑制在无监督域自适应过程中图像无效区域可能导致的负面影响,利用端到端可训练的注意力模型取代原来的生成器,提取主要的迁移特征。本文共完成了以下几方面的工作:(1)改变了以往域自适应学习需要对源域和目标域的全局图像进行对齐的方式,在卷积网络中使用注意力机制,使得注意力网络能提取对域自适应任务有效的注意力特征,抑制无效信息的干扰,增强域自适应模型的泛化性;(2)和以往在域自适应过程中标签丰富的源域数据和无标签的目标域数据需要分开训练的方式不同,本文改变了域自适应学习固有的训练方式,在源域数据中添加少量带标签的目标域数据,形成新的“源域”数据集,使得网络在训练源域数据的同时了解目标域数据的概率分布的知识,提高模型对目标域数据的泛化性。
其他文献
目标检测作为计算机视觉领域的基本问题之一,得到了越来越多的关注。它是从图像处理到图像理解之间的关键步骤,其主要目的是为了从图像中识别出待检测目标,完成场景理解或行为分析的第一步,因而被广泛地应用到各个重要领域,如视频监控、智能交通、生物特征识别等。然而,目标检测技术依旧有很大的上升空间。针对实际场景中目标尺度大范围的变化,单一尺度的检测方法很难平衡虚检和漏检的问题。传统目标检测技术的处理方式就是采
在各种人机交互方式中,语音交互是其中非常重要的一种。尤其是通过自然语言的方式进行交互,是最直接、友好的方式,而自然语言语意理解技术在语音人机交互中有着重要的作用。本文就人机交互中,自然语言指令的理解算法进行研究。首先,根据家庭服务机器人的使用环境和应用场景构建了一个自然语言文本指令语料库,建立了意图树,并对语料库中各类指令进行意图标注,从而把文本指令理解问题转化为文本分类问题;其次,在传统的文本向
一代身份证作为频繁使用的有效证件,携带个人基本信息、身份证号码和人脸照片。本文身份证识别包括OCR字符识别和跨年龄人脸识别。由于提取的字符图像往往是断笔粘连模糊的低
随着近年来计算机图像处理技术与可视化技术的发展,对文物碎片进行数字化保护与复原,可以提升文物碎片修复的工作效率,推动计算机与考古学的学科融合发展。文物碎片数量庞大,
热成像技术记录物体表面的温度信息,在军事、航天、工业、医学、安防等领域均有广泛应用。在医学中,体温是人体组织异常活动的指标之一,因此通过深入分析热红外图像可诊断特
液压四足机器人是采用液压作为动力源进行驱动的,凭借适应性强、运动灵活等特点,被广泛应用于航空航天、军事工业、服务领域等。随着液压四足机器人的广泛应用,对关节驱动要
近年来,高校的图书馆藏规模不断扩大,图书数量骤增,种类繁多,面对数量众多的馆藏图书,学生去借阅比较感兴趣的图书需要耗费大量的时间和精力,如何更有效的借阅书籍成为学生比较关心的问题,因此,图书的个性化推荐应运而生。个性化推荐已经成功的应用到了电子商务、购物消费等领域,通过对大量的用户信息进行处理、分析和发掘得到用户的行为偏好。但传统的推荐方法往往结果不是很令人满意,需要对传统的协同过滤算法进行改进。
近年来,在我国新型城镇化战略规划下,我国城市化进程不断加快,棚户区的存在成为城市化进程中的一大阻碍。为实现我国新型城镇化战略目标以及提升棚户区居民的生活幸福感,棚户
基于口令的认证方法因开销小、使用便捷,故成为目前使用最广泛的身份认证方式。正是因为使用简单,口令也一直存在着严重的安全问题:(1)来自不同语言的口令集具有明显不同的字
遥感图像是国防、航天、城市规划等多个领域所需的一类重要数据.遥感图像处理已受到众多学者的广泛关注.在机器学习算法盛行的潮流下,如何将机器学习与遥感图像处理相结合,以