基于深度学习的显著区域保留的风格迁移方法

被引量 : 0次 | 上传用户:NF_Frankie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着5G网络的兴起,制作一张具有丰富艺术风格的图像并分享在网络社交平台账号上变得越来越流行。风格迁移方法主要是对整幅图像添加风格化的纹理、颜色等处理。基于深度学习的风格迁移方法可以将不同的艺术图像应用在内容图像上,最终生成风格化图像,极大的增强了人们的视觉感官。但这些方法都有个问题,那就是在风格迁移过程中容易忽略原本图像的语义信息导致内容图像失真、变形。因此,本文提出了一种新的改进方法,该方法可以更加关注内容图像的显著区域,且生成的风格化图像在保留原本语义结构的同时产生更好的风格化效果。本文的研究成果如下:(1)针对风格迁移网络中语义特征缺失的问题。设计并实现了基于深度学习的任意风格迁移方法。通过VGG-19模型来获取图像的数据,同时优化网络模型的组成结构使得该网络更适合提取图像特征信息,并通过建立起来的网络来计算内容图像和风格图像的损失函数。(2)针对风格迁移网络中最终生成图像视觉效果不理想的问题。在风格迁移网络中加入注意力机制来有效降低网络的训练时间成本,提高风格迁移模型的性能,使得训练好的风格迁移模型更加关注图像的关键区域,提升图像生成质量。(3)针对风格图像语义缺失的问题。研究并改进了语义分割网络,该网络用来划分内容图像的不同区域。首先是通过构建改进的Deeplab V3+网络结构,利用多尺度特征网络提取图像中有用的信息,得到各部分的语义掩码图,实现图像语义分割任务,然后利用各个区域的掩码图实现多区域风格迁移。(4)设计并实现了基于深度学习的显著区域保留的风格迁移方法。为了验证该方法的可行性和有效性,通过严谨的实验将该模型与其它经典的风格迁移方法进行对比,验证本文风格迁移模型的优越性,并采用多人主观视觉感受评比的方式得出风格迁移效果的比分。
其他文献
近年来,区块链技术经历了飞速发展,从最初仅用于数字货币领域,到现如今为金融、医疗、教育、工业等多个领域带来全新的解决方案和发展机遇,区块链技术目前在全球范围内受到认可和深入研究。共识机制作为区块链技术的核心组成部分之一,是确保系统安全和可靠性的基石。共识算法性能的高低直接决定了整个系统的效率和可用性。因此,设计一个高效的共识机制对于提升区块链系统的性能和保障安全可信具有至关重要的意义。本文对区块链
学位
图像着色的目标是将灰度图像中每个像素分配适当的颜色,以生成视觉信息更加丰富的彩色图像。该技术在数字艺术、医学成像和影视制作等领域具有广泛的应用前景。灰度图像在同一灰度值可对应多种颜色,这使得图像着色问题具有不确定性。如何生成合理的彩色图像是计算机视觉领域中一项具有挑战性的任务。随着计算机图像处理能力的提高和技术的不断进步,基于深度学习的图像着色研究也在生成图像的效率和颜色效果方面取得了进展。然而,
学位
工业相机的成像元件大多是以电荷耦合元件(Charge Coupled Device,CCD)与互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)为主的传感器。此类传感器不具备颜色恒常性功能,在图像采集过程中,会因红外光线的串扰导致图像呈现出不正常的红色状态。现有的解决办法是在图像采集装置的镜头前端加一个红外截止滤光片,以此来消除图像采集
学位
人类通信的本质是进行知识交换的过程。1953年Weaver提出了技术、语义、效能三层次通信模型,为现代通信系统的设计奠定了理论基础。随着人工智能的快速发展,通信设备的智能化水平和通信设备对外界的认知能力不断提高,为深入开展Weaver提出的第2层次的语义通信难题研究提供了可能,智能体语义通信也逐渐成为通信领域的一大研究趋势。现有的智能体通信工作主要集中在第1个层次,即通信符号如何准确传输,部分学者
学位
随着深度学习与人工智能技术的不断发展,人机交互在当前已经不再是一个陌生的话题,为了有更好的体验,人脸表情识别成为一个新的研究热点。深度学习的出现取代了传统手工提取人脸表情特征的方式,使得人脸表情识别技术得到了飞速提升,残差网络的提出使人脸表情识别的表现更上一层楼,但是如何设计一个好的残差网络,以便更有效地提取人脸表情识别所需的特征,从而提高其准确性,仍然是当前研究的重点。针对上述问题,本文选用Re
学位
通常要进行三维场景的构建需要真实环境的支持,室内环境的三维场景重建一般由激光雷达或视觉传感器完成,由于激光雷达成本高花费大,重建出来的结果缺少彩色信息,因此选用视觉传感器和SLAM系统,然而SLAM系统重建出来的地图依然是稀疏的场景地图,跟进工作无法继续。为了解决上述问题,本文主要利用多源传感器(深度传感器和IMU惯性传感器)融合的室内环境稠密三维重构方法,从而补充了缺失的室内环境数据,保证了正常
学位
随着现代医学模式的转变和人们对健康概念的更新,人们也越来越关注口腔健康和口腔美观,如何快速培养合格的年轻外科医生是一项非常紧迫的任务。因此,本文所开发的基于力反馈的口腔临床虚拟教学系统(Oral Clinical Virtual Teaching System,OCVTS)可以缩短口腔医生手术训练周期,有利于缓解现阶段口腔医生短缺的局面,为满足人们对美好生活的需要具备重要的现实意义。本文研究内容如
学位
随着第四次工业革命浪潮的到来,智能产品已经进入人们的视野。移动机器人是机器人的重要组成部分之一。在移动机器人所涉及的关键技术中,一个重要的问题是机器人导航。其中,在未知的复杂环境中,SLAM(Simultaneous Localization and Mapping,同时定位与地图构建)技术在机器人工程中发挥着至关重要的作用。由于单个传感器只能检测到有限的信息,它们在智能产品中的应用仅限于发出简单
学位
时间序列数据反映了时间和事务两者之间的变化过程,挖掘隐藏在时序数据中的规律变得非常重要。本课题研究的主要目标就是寻找一种采用波形匹配算法,以解决在海量的时序数据中查找与某一段波形相匹配的数据段此类曲线搜索问题。本文主要研究工作如下:1)CNN提取曲线特征过于随机,而且要查找的曲线目标是临时给出的,并没有多余的训练样本。本文使用相关时序数据集作为训练样本,解决提取曲线特征过于随机的问题,使用孪生神经
学位
随着数字化技术与手术导航技术的快速发展,口腔植入引导技术已成为现代口腔种植导航及相关诊疗器械研究的重点。本文针对当前种植导航领域的热点问题,研究了基于多传感器融合的车针目标跟踪方案,采用基于灯塔激光的VR定位技术和相机光学定位技术,提出的融合方案包括预处理阶段、基于不同传感器的初步定位解算阶段、数据融合测试阶段。研究包括基于不同传感器定位的目标位姿解算模型和种植导航的误差控制、多传感器融合方案的实
学位