【摘 要】
:
图像翻译指的是将输入图像从源域映射到目标域,使其拥有目标域的特定属性。图像的属性可以根据图像的基本特征或图中的具体应用场景和目标对象来定义,例如可定义图像的分辨率、色彩等基本属性,也可定义场景图像所处的季节、天气属性以及人脸图像的表情、年龄属性等等。图像翻译在许多图像处理任务中有着广泛的应用,包括图像风格迁移、图像超分辨率、人脸属性编辑等等。本文要解决的多域图像翻译问题是对于给定的多个图像域,实现
论文部分内容阅读
图像翻译指的是将输入图像从源域映射到目标域,使其拥有目标域的特定属性。图像的属性可以根据图像的基本特征或图中的具体应用场景和目标对象来定义,例如可定义图像的分辨率、色彩等基本属性,也可定义场景图像所处的季节、天气属性以及人脸图像的表情、年龄属性等等。图像翻译在许多图像处理任务中有着广泛的应用,包括图像风格迁移、图像超分辨率、人脸属性编辑等等。本文要解决的多域图像翻译问题是对于给定的多个图像域,实现图像从源域向其他任意一个域转化,生成图像不仅要获得目标域属性,同时要保留原图像的属性无关细节。主要应用于场景图像在多个天气、季节域中转化,来实现包括图像去噪、图像自动化的批量编辑以及虚拟场景模拟、仿真等任务。生成对抗网络(Generative Adversarial Networks,GAN)基于零和博弈的思想,通过生成器和判别器相互对抗的过程,辅助生成器学习真实样本的分布,在图像生成上有突出的表现,因此目前大多数图像翻译方法都是基于GAN方法。本文基于生成对抗网络提出多域间的图像翻译模型,并在不同数据集的上实现有监督和无监督的翻译方法。主要创新点如下:(1)预处理得到一批成对的天气数据集后,提出了一种基于成对数据集的多域图像翻译方法。模型基于Att GAN网络框架,在生成器中加入压缩激励模块为特征图分配权重来充分利用有效的中间特征图,以及利用预训练的VGG19提取真假样本的高维空间特征,计算得到感知损失并结合L1损失来进一步约束生成空间。通过大量的对比实验证明了这两点改进能够有效提升生成图像质量,并且在恶劣天气向晴天翻译的应用中取得最好的效果。(2)提出了一种基于不成对数据集的多域图像翻译方法。模型基于生成对抗网络,并结合Single GAN中的域编码映射和多判别器方法。主要创新点是在生成器中加入了空间特征转换层,利用图像的分割语义信息指导图像生成过程。通过在不成对的交通场景相关的天气数据集上训练模型,并与其他同类模型对比后,证明我们的方法能够生成高质量且多样化结果。同时将模型应用于季节和瞬态场景属性数据集上,得到模型具有可拓展性的结论。
其他文献
伴随着改革开放的伟大进程,现代博物馆已然成为一个国家、一个城市重要的文化教育机构,同时也是公众游览休憩的重要场所。科普场馆肩负着向公众传播科普教育的使命,同时又作为地区或城市重要的旅游景点,始终吸引着大批来自四面八方的游客纷至沓来。伴随着场馆服务类型的不断延伸发展、公共服务能级不断提升,场馆自身除了需要不断经受大客流考验,重视观众人身公共安全管理以外,科普场馆公共服务质量的管理也是尤为重要的。本文
2019年底至2020年初突如其来的新型冠状病毒肺炎疫情给我国经济发展带来了巨大冲击,企业停工停产,学校停学,给人们的工作、学习和生活都带来了极大的不便。随之而来的是,用人单位需求的急剧下降、高校应届毕业生就业压力的增大。本研究为质性研究,采用目的性抽样的方法选取了来自5个城市12所高校的17名社会工作专业硕士应届毕业生为研究对象,旨在探究其在新冠肺炎疫情下的求职体验。本研究借用马克思·范梅南对于
高等植株进行光合作用的主要细胞器为叶绿体,叶绿体的组成部分包括外被(chloroplast envelope)、基质(stroma)和类囊体(thylakoid),基质是光合作用过程中暗反应发生的场所,类囊体则
本文以H村宅基地改革试点政策为研究对象,首先对宅基地改革和政策评价的概念进行阐述。在研究S-CAD政策评估与分析方法的理论及应用的基础上,构建基于S-CAD方法的宅基地改革政策评价框架。以H村的宅地基改革试点政策为案例对象,通过分析总结相关政策文本及改革实施推动方案,在对H村宅基地改革政策的价值前提、目标、手段和结果要素进行识别的基础上,对要素间的一致性、充要性和依赖性进行评价。通过各项分析结果,
随航空航天、5G、虚拟现实、人工智能、柔性可穿戴、新能源等技术飞速发展,对热管理材料的需求越来越多样化。对于新一代高功率、高度集成、体积更小的电子产品需要解决电子
当前,由于消耗传统化石材料而导致的日益加剧的能源危机和环境污染问题已经阻碍了人类社会的可持续发展。因此,寻找可再生替代能源已成为一个关键问题。由于高能量密度和无碳
量子纠缠是量子信息的物理资源,它在量子通信,量子隐形传态,以及量子计算的各种任务中起到了重要的作用.正是因为这样,人们越来越关注量子纠缠的各种性质.近年来,非惯性系下
大气压介质阻挡放电(DBD)作为能够产生均匀、稳定低温等离子体的重要手段,因近些年在材料加工、薄膜沉积、表面改性等方面具有应用潜力备受关注。本质上,DBD是复杂的放电系统
流动儿童的生活环境和家庭教育具有一定的特殊性,“流动的经历”可能使其更容易出现学习适应不良、学习兴趣减退和学习偏差行为增加等状况。其中,学业拖延则是一个较为普遍的学业偏差行为,是一种消极的心理倾向和回避性行为反应。小学阶段是儿童的生理、心理成长发育关键期,对这个阶段的流动儿童来说,学业拖延对其学业成就、学业效能感、日后的生活态度与行为习惯、亲子关系等方面都存在消极影响。如果不加以干预,它对当下和未
随着深度学习的快速发展,文本识别技术逐渐应用到医疗领域。本文旨在研究中文病历文本图像的识别方法,针对以卷积神经网络为基础的识别算法对中文病历文本识别精度不高的问题,提出了一种基于残差的多尺度特征提取网络,并在此基础上结合了不同尺度的自注意力机制,相比基于卷积神经网络的识别方法,本文提出的方法具有更好的特征提取和分类能力,提高了对中文病历文本图像识别率。中文字符拥有比其他常见字符更复杂的结构,实际的