基于对抗网络的稀疏分组和混合数据学习的人脸图像语义翻译的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jeff006902000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像翻译的本质是从一个源域图像到目标域之间建立映射关系,这个映射可以是1v1,也可以是1v多,甚至多v多。显而易见的是,图像翻译在计算机视觉和计算机图像学领域具有巨大的实际应用价值,比如图像上色问题,生活中的灰度图像如何快速地转换为彩色图像。最近,基于对抗网络的图像翻译方法为图像域之间的映射提供了一个通用的框架。基于对抗网络的图像翻译算法已经被应用到更广泛的领域,比如图像的风格化、卡通化、图像的修复,以及用来解决领域自适应问题。细节上,先前的图像翻译算法可以被归结为两大类,一类是基于数据对的学习方法和基于分组数据的学习方法。本文认为它们都是基于监督学习的算法。当对分组的量和每个组中的样本需求都是很大的时候,这些算法依然需要大量的人力去做标注。为了缓解这个问题,我们猜想了两个模型,一个是基于稀疏分组数据的模型。稀疏分组数据意味着数据集中只有少部分具有分组的组标签,而大部分是不具有任何标签。对于具有标签的数据,它们可以做分类的学习,其余的无标签数据则可以利用无监督学习算法去提高网络的表征能力,进而提高网络分类的表现力,无标签数据还可以用来稳定对抗网络的训练。从某种程度上说,稀疏分组学习是一种半监督学习算法。显而易见的是,稀疏分组学习会大量地减少对数据中的分组标签的要求。我们在本文中也猜想了对应于稀疏分组的网络架构,并将整个模型简称为SG-GAN。当数据完全稀疏,也就是数据集没有任何标签,此时的数据形态本文称其为混合数据。我们同样提出了面对混合数据的模型,也就是通过最大化互信息来从混合数据中发现语义信息,最后控制低维度的隐变量来改变高维图像空间的语义内容,实现图像翻译的目的。在本文中,我们将此模型简写为ST-GAN。为了验证猜想的SG-GAN和ST-GAN算法的有效性,我们将它们应用到人脸语义属性的调整。人脸语义属性的调整,可以被归类为图像翻译领域的一个在人脸数据上特定应用。比如对于属性年龄,人脸语义调整的目的则是希望在保持输入图像中身份信息的同时,改变他的年龄。本文猜想的SG-GAN在人脸多个属性调整上取得了高质量的转换结果,在标准的定量和定性的评估上超过了同时期的最优算法。除此之外,在转换的过程中为了保持输入人脸的身份信息,我们提出了一个自适应残差图像学习。本文猜想的ST-GAN,据我们所知,是第一个在完全没有任何标签信息上的图像语义翻译算法,尽管从质量上很难和最优的进行对比,但是ST-GAN利用无监督学习算法去捕获数据中的语义信息,然后利用这些语义信息能够做到先前的算法很难实现的属性调整。除此之外,本文为了提升网络语义发现的明确性,我们提出了一个局部互信息最大化方法去缓解这个问题。
其他文献
目的:黏膜恶性黑色素瘤是一类由基底层黑色素细胞发展而来的高度恶性肿瘤,预后极差,5年生存率仅为20%左右,好发于东亚人群,欧美人群较少见,国人黏膜恶性黑色素瘤在全身恶性黑
随着注水开发的深入,油田高耗水层现象越来越普遍,想要进一步提高开发的经济效益就必须探寻一种经济有效的高耗水层识别方法。鉴于此,本文简要回顾了高耗水层识别技术的发展
工具与技术的革新是助力时代发展的重要标志,当今信息化时代下的世界环境可以被定义为“与传感器、新型显示器件、集成电路、大数据和云计算等多种技术元素无形地交织在一起,无缝嵌入我们日常生活中并通过物联网连接的世界”。随着越来越广泛的对象与物联网接入而被赋予了能更好实现通信、感知、智能决策和自动化的功能。因此,供应链领域的发展也应顺应时代潮流,积极拥抱信息化技术以提升时代竞争力,智慧化的供应链将为降低成本
煤与瓦斯突出是影响深部煤炭安全开采的主要灾害之一,随着采深的递增,地应力和煤层瓦斯参数也不断升高,加剧了煤与瓦斯突出的严重性。深部条件下,传统区域防突措施存在工期长
手的抓握运动在人们日常生活中占据重要作用。近年来抓握操作的感觉运动控制分析方法不断进步,主要集中于单一因素(大小,形状,重量等因素)的感觉运动控制,而对于视觉和触觉的多模式感知运动控制的研究相对较少。并且当今社会随着人口老龄化形式愈发严重,阿尔兹海默病(AD)的发病率也逐年上升,AD会造成不同程度的手功能运动障碍,在临床上对AD早期的诊断多集中于问卷调查,未能很好的预防该疾病的发生。因此,本论文的
脊柱植入物市场,是医疗高值耗材市场的一个细分市场。作为医疗产品,既要能满足人民生命健康,提升生命质量的要求,又要避免过度医疗,无谓耗费医疗费用。本研究试图通过我国脊
多自由度电液振动与加载耦合系统将电液伺服驱动下的多自由度振动系统和多自由度加载系统结合,旨在实现振动环境和加载环境的耦合复现,以期适应被控对象日益复杂工作环境的模
虚拟化已经成为云计算的基础,因为它可以通过在单个物理机器上运行多个操作系统和应用程序来最大限度地发挥硬件潜力。但是,传统的机械硬盘已经不能满足云计算高速处理数据的
钛合金材料因其密度小,强度高,耐腐蚀性好,在航空航天工业中有着广泛的应用。在钛合金缺口结构件中,由于缺口处严重的应力集中,在服役载荷下更容易出现疲劳问题。其疲劳寿命
库鲁克塔格位于塔里木克拉通与中亚造山带南缘的交界处,所以其地壳演化对于了解南天山洋的演化过程非常重要。目前为止,因为缺乏示踪岩浆源区和物质来源的资料,所以对南天山