基于像素间相似性关系的无监督域自适应语义分割研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:huanxia185
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在深度学习技术的推动下,强监督语义分割技术取得了极大的进展。强监督语义分割的性能依赖于大量高精度稠密的标注数据,成本十分昂贵。为了解决语义分割对数据的需求,学者提出利用合成数据替代真实数据来训练语义分割网络。合成数据可以自动生成,规模大,成本小,有着巨大的应用价值。然而,由于域间差异存在,利用合成数据训练的分割模型在真实数据上性能会急剧下降。本文致力于开发无监督域自适应语义分割算法来解决这一问题。
  当前的无监督域自适应语义分割算法尝试从图像像素层面、网络特征层面或网络输出层面上对源域和目标域从独立像素位置的信息进行对齐。与之前方法不同的,本文在源域和目标域分割输出空间结构具有域不变性这一事实的启发下,提出通过利用分割输出成对相邻像素的共存性在语义分割的结构层面上来进行域适配。为了利用分割结果的域不变特性进行域适配,本文提出针对分割网络输出成对像素间的关系来进行无监督域自适应语义分割的两种策略。
  (1)本文提出了一种新的无监督域适配语义分割损失函数。一方面,语义分割将图像划分成了不相交的区域,同一区域内的像素享有相同语义类别。另一方面,本文基于实验观察发现域间差异会使得目标域的分割结果区域的连续性变差。本文提出相邻相似性空间平滑损失函数,约束局部的成对相邻像素分割输出一致来减小这种影响。相较于之前的域适配损失函数,本方法对不同类别梯度更加均匀,且获得了更佳的域适配效果。
  (2)本文提出了一种新的基于对抗学习的无监督域适配语义分割框架。不同域的语义标签空间具有相似的空间布局和类别共存性。本文引入相邻相似性空间概念,通过利用分割网络的输出的成对像素关系来编码这些特性。通过利用对抗学习来减小源域和目标域相邻相似性空间的差异,本文将源域分割的类别共存性传递给目标域。相对比之前的方法,本文首次证明利用像素相邻相似性关系对无监督域自适应语义分割有帮助且性能优于之前的方法。
  两种域适配方案都在多个具有挑战性的基准数据集上获得当前最高或具有竞争力的无监督领域自适应语义分割结果。
其他文献
伴着一场大雪,北京迎来了2010年,21世纪第二个十年的开始。  2010年,作为时间轴上的新坐标,它本身并没有特别的含义,和每天的日出日落一样,平凡而新鲜。但当时间和人们的期望与梦想结合在一起就变得不太一样。  已经过去2009年,我们在去年第12期杂志上做了全面的盘点。面对新年,数码圈又将会有怎样的风景7全球最大的消费电子展CES2010即将召开,新一年的技术和产品也慢慢揭开面纱,向人们展示新
期刊
文本检索旨在对给出的查询,在文档集合中找出与之最相关的文档子集。它能有效地对文档中的语句词义进行压缩整合,并与查询进行匹配,利用计算机在处理海量数据上的优势,为人们迅速缩小查阅的范围,极大地提高了筛选与处理信息的效率。本文在对文本检索模型进行研究时发现,文本检索主流模型采用的是构建输入查询与文本的表示,文本与查询的关系取决于表示的相似程度。这种模型往往存在无法解决长距离依赖、无法对语义很好地建模的问题,导致模型的向量表示不能准确地表示出文本的语义信息。因此,本文认为目前的主要挑战是如何对原文本进行更好的向
文本风格转换旨在转换文本的风格,而不改变语义内容,是一种可控的文本生成任务,易与其他自然语言处理任务融合,具有重要的研究价值。由于缺乏内容相同而风格不同的平行语料,需借助无监督学习来实现文本风格转换。本文重点研究了基于风格联合表征与内容对齐循环重建的无监督文本风格转换方法。设计了基于对抗性变分自编码器的无监督文本风格转换模型。通过鉴别器与变分自编码器的对抗性训练,将源端句子的内容和风格在潜在空间进行分离,得到与风格无关的文本内容表示。将目标风格的表示和文本内容表示一起作为生成器的输入,从而生成目标风格的句
随着社会的快速发展,无线通信已经逐渐发展成为人们的基本生活需求之一。当前,无线通信系统采用跳频和直扩方式来抗截获以及抗侦收,随着截获能力和信号识别处理算法能力的提高,跳频和直扩方式抗截获以及抗侦收能力显得日益薄弱。跳相扩频调制能在不增加系统带宽的情况下,提高无线通信系统的抗检测性能、抗截获性能以及抗侦收性能。为了防止非合作方窃取有效的信息,服务于跳相扩频调制的跳相序列应该具有良好的随机性、复杂性和不可预测性。本文具体工作如下:
  研究了伪随机序列相关理论,跳相扩频调制方法。针对跳相扩频特点,提出了
低轨卫星通信在通信领域具有重要意义和广阔应用前景。本文重点研究了Polar码在低轨卫星通信中的性能,并在块衰落信道下提出了改进的极化重量构造算法,具有重要的理论与实际意义。
  本文根据信道传输特性随时间变化的快慢程度,将低轨卫星信道分为信道缓慢变化、固定周期缓慢变化和快速变化三种情况并分别建模为高斯信道、块衰落信道和Corazza信道。同时,在介绍了Polar码的基本原理和编译码算法的基础上,研究了Polar码的构造算法。在块衰落信道下,本文将衰落系数的作用看成是“衰落极化”的过程,提出了改进的极
科技的进步,推动社会的发展,为各行各业带来滚滚财源的同时,也使人们能享受越来越好的生活。在过去的20年间,科技上的进步带动经济高速发展,而人们,也因科技将生活变得更美好,当现代生活变得越来越复杂时,智能计算帮助我们化繁为简。至于未来,那些现在看起来是不可思议的事情,在将来或许就如电脑之于今天一样普通。  记忆,是个奇怪的功能,有些东西时间越久记忆越清晰,有些不久之前的事情,倒仿佛发生在遥远的上古世
期刊
图像表示是图像的基础,不同类型的表示以不同角度展示着图像的不同特征。例如,基于像素的表示直接地使用像素颜色、纹理或亮度对图像的每个像素进行表示,提供着图像的低层特征;而基于区域的表示则使用有意义的标签对图像的区域进行赋值,关注于图像的高层语义。某种意义上讲,图像处理和计算机视觉可以看作是对图像提取特征并将其转化为另一种图像表示的过程。
  最近的深度卷积神经网络使用着不同的图像表示进行监督,学习去解决不同的视觉任务。然而,本人发现,对于密集语义预测的任务,传统的图像表示通常忽略了像素之间的空间关系,
图片是人类传播信息的重要媒介。近年来计算机视觉的蓬勃发展离不开大量的图片和其标注。研究如何能自动化生成数据可以降低标注工作量,也能满足人类特定化编辑图像的需求。作为生成任务中的一种,变形图像生成因输出和输入存在极大的结构差异而极具挑战性,但其巨大的实际应用价值吸引着学者们不断进行深入调研。
  考虑到生成对抗网络在图像生成上的优异表现、泛用性和灵活性,本文对生成对抗网络进行结构和方法调整,用于应对两项极具应用价值的变形图像任务:中国书法生成和姿态变换。针对两项任务的特点,展开了如下研究:
  
图片是一种重要信息载体。随着移动设备和互联网的普及,人们越来越多地通过图片来记录生活的点点滴滴。与此同时,随着人工智能技术的高速发展,如何让机器像人类一样自动高效地理解图片中的语义信息获得了空前的关注,促进了语义分割技术的出现和发展。语义分割在多种真实应用场景中都存在着巨大的需求,是自动驾驶、人物行为分析、医疗诊断等多种技术的基石,为未来的智能时代勾画了一个美丽的蓝图。
  然而,图片质量的差异性U不同的光照条件、遮挡、分辨率等V和图片内容的复杂性U多种多样的场景和物体类别V为语义分割任务提出了巨大
20世纪初,是一个神奇的年代,各种各样的工业科技奇迹,至今影响和改变着人们的生活,而本世纪的工业奇迹,则不得不说iPhone。所谓颠覆,并不是对过去的否定,而是用一种全新的视觉和体验,将以往的科技升华。这个风靡全球的时尚玩意,将手机不再简单的定位于通讯产品,丰富的互联网应用,使得每一个使用者,仅仅用拇指,就可以掌控生活。    联通iPhone 3Gs迄今最快最强的iPhone    作为最新一代
期刊