基于生成对抗网络的图像翻译研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:Ling_cheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像翻译是计算机视觉的一个重要研究领域,其旨在学习源域和目标域之间的映射关系,并通过该映射实现特征交换。图像翻译主要分为两大类:基于监督学习的图像翻译和基于非监督学习的图像翻译。基于监督学习的图像翻译主要应用于图像生成、图像修复和图像超分辨率等领域,但这些算法需要大量成对的训练数据集,极大地限制了其应用场景。在实际的图像翻译任务中,获得大量的成对训练数据集需要耗费很大的成本,而且有时候无法获取,所以基于非监督学习的图像翻译是一个热门的研究方向。针对非监督的图像翻译,本文提出了两种深度学习网络结构:基于图像级别的翻译网络(Cycle-IDRL)和基于实例级别的翻译网络(GAT-DR-IIT)。Cycle-IDRL网络分别为生成器和判别器添加一个额外的输入:将目标域样本输入判别器中来提取特征,并将特征输入生成器中来构造与目标域样本对应的重构样本。Cycle-IDRL网络不仅可以提高翻译图像的质量,而且可以提高判别器的性能。GAT-DR-IIT网络包含注意力模块和特征编码模块:注意力模块指导网络关注感兴趣的实例并生成注意力掩码图,这有助于分离图像的实例和背景;特征编码器模块将图像嵌入到两个不同的空间,即域的内容空间和域的属性空间,并将不同图像的内容特征和属性特征同时输入生成器中,进而达到可控的图像翻译。GAT-DR-IIT网络不仅提高了实例级图像翻译的质量,而且在此基础上增加了可控性。在多个经典的数据集上对本文提出的两个图像翻译网络进行相关实验。实验结果表明,基于图像级别的翻译网络在图像生成质量上有明显的提高,基于实例级别的翻译网络在图像生成质量和多样性上都有明显的提高。
其他文献
随着互联网数据交换的爆炸式发展,数字视频得以在网络上广泛传播,与此同时,视频被非法用户复制、篡改的现象频繁发生。多媒体的安全与版权保护正受到人们的广泛关注。近年来,水印技术以其不可见性、鲁棒性以及有效嵌入量在视频版权保护领域大放异彩,是数字版权保护的有效方法之一。其中主流的视频水印技术是在视频关键帧上嵌入水印。然而现有的关键帧提取方法存在冗余或者漏检现象,未能很好的反映视频内容,并且其他多数视频水
学位
2025年全球物联网设备将达到416亿台。工作在2.4GHz的Wi-Fi和Zig Bee是目前物联网主要使用的两种通信技术,异构物联网通信CTC(Cross-Technology Communication)实现了两种网络物理层的数据融合,解决了信道争用导致的信道利用率低等问题。但由于传输范围差异,发送端一跳发送数据,接收端需要多跳返回确认,这将导致较长的传输延迟,尤其在低占空比的Zig Bee网
学位
随着信息技术的蓬勃发展,人们对软件的需求与依赖越来越多,而软件的规模与复杂度也呈现递增式增长。软件中存在缺陷难以避免,其中,程序语义缺陷是一类典型的软件缺陷,程序语义缺陷的存在将导致程序运行时出现系统瘫痪、运算结果不正确、性能降低、安全漏洞等各种问题。静态分析技术是检测语义缺陷的一种有效方法,但由于在数据流分析与缺陷检测过程中的某些保守处理,检测出的警报只是可能是缺陷,其中可能会存在误报,而误报的
学位
伴随着摄像头等硬件设备的快速升级,计算机视觉技术得到了蓬勃的发展。单目标跟踪作为计算机视觉的重要分支,被广泛的应用在智能交通、智能安防、无人驾驶和智能机器人等领域。深度学习作为人工智能领域一种有效的工具,能够通过大规模数据训练,高效的处理计算机视觉中图像分类、检测等问题。将深度学习中的卷积神经网络与单目标跟踪算法相结合,将会极大的提高跟踪算法的性能。通常,使用卷积神经网络的单目标跟踪算法被分为3类
学位
我国工业发展迅速,对现代机械设备的规模、精度和复杂性的要求不断增加。如何使机械设备能够稳定且高效的运行,是各企业急需解决的问题。然而,随着运行时间的不断增加,零部件的性能也会逐渐下降,外界环境复杂多变性也会影响机械设备的运行状况,这些复杂因素的影响,导致机械设备发生故障具有不可避免和随机性。因此,在机械设备的有效寿命期内,故障诊断和预测能够为机械设备的平稳运行提供有力保障。在没有使用故障诊断和预测
学位
近几年来随着社会的高速发展及人们生活的提高,汽车逐渐普及,因此,对车辆行驶安全问题有了更高要求,道路交通标识的自动检测与识别在安全驾驶中的作用也越来越重要。基于交通标识的道路驾驶辅助系统的出现,不但能减少驾驶人员的精神压力,也能大大避免交通事故的发生。交通标识的识别就成为道路驾驶辅助系统实现过程中的关键一环,及时、准确识别汽车行驶过程中的交通标识,可以有效提醒驾驶员因疏忽或者因盲目超速等不良行为而
学位
近年来,随着人们生活质量的逐渐提升,心脏病的发病率急速增加。疾病风险分析技术作为一种常见的预防手段,利用患者健康数据进行患病风险分析,以达到在发病潜伏期对疾病有效干预的目的。然而在实际应用中,患者的健康数据往往带有极强的隐私性,并且数据具有维数较高、线性关系较弱的特点,使得现有的疾病预测模型难以达到最佳效果。因此,疾病风险预测模型的研究是医疗领域的热点,具有重要的理论意义和极高的应用价值。本文以心
学位
传统监控系统广泛应用于油田施工现场的险情监测中,但需要工作人员花费大量的精力查找监控视频中的险情。基于目标检测技术的监控系统,能够自主识别目标,减少对工作人员的依赖,但同时存在对小目标检测不佳的问题。为解决上述问题,本文提出了基于残差网络和改进特征金字塔的SSD算法(Residual Network and Improved Feature Pyramid SSD,RP-SSD)。首先,自主构建油
学位
皮肤病是人类最常见的疾病之一。近年来皮肤病的种类和发病率不断增长,发展成皮肤癌的病例越来越多。全球每年大约有2到3百万的皮肤癌新增病例,严重危害国民健康。皮肤癌的早期诊断和治疗对于患者恢复健康有极大意义。色素性皮肤癌类间相似度高、类内差异化大,给医学诊断工作带来了负担。随着科技的发展,深度学习已经在诸多领域得到了广泛应用,特别是在智慧医疗领域的发展。通过医学图像处理技术,结合计算机的分析能力,辅助
学位
随着计算机时代的发展,图像修复技术已经得到广泛应用,成为计算机视觉领域中的一个重要任务。最近,基于深度学习的方法在图像修复这种复杂问题上已经显示出有希望的结果。这些方法从缺失区域上下文生成语义连贯的补丁,能够生成视觉上可信的图像结构和纹理,但容易产生与周围区域不一致的伪影图像。相比之下,传统的图像修复方法通过复制图像补丁来填充缺失区域,修复效果平滑,但无法学习到图像的高级语义信息。本论文针对目前图
学位