【摘 要】
:
随着深度学习网络的发展,图像风格迁移成为人工智能研究领域的热门方向之一。风格迁移算法作为计算机科学与艺术领域的有效结合,赋予了计算机艺术再创造的能力。图像风格迁移技术不仅在学术界不断创新迭代,而且在工业界的应用也得到实践和拓展,其在商业价值和艺术创作等方面都展现出了巨大的潜力。目前,风格迁移技术主要是对图像整体进行迁移,对于西方画作的图像迁移,而仅针对图像局部区域、针对中国画的目标风格迁移研究相对
论文部分内容阅读
随着深度学习网络的发展,图像风格迁移成为人工智能研究领域的热门方向之一。风格迁移算法作为计算机科学与艺术领域的有效结合,赋予了计算机艺术再创造的能力。图像风格迁移技术不仅在学术界不断创新迭代,而且在工业界的应用也得到实践和拓展,其在商业价值和艺术创作等方面都展现出了巨大的潜力。目前,风格迁移技术主要是对图像整体进行迁移,对于西方画作的图像迁移,而仅针对图像局部区域、针对中国画的目标风格迁移研究相对较少。目标风格迁移作为风格迁移任务的一个子任务,具有与全局风格迁移不同的特点和要求。目标风格迁移任务拆解成目标提取、风格迁移和图像融合三个子任务。目标提取任务需要从图像中提取出目标对象,包括其分类信息,定位信息与空间布局信息。风格迁移任务与全局风格迁移一致。图像融合任务需要将生成的山水风格化图像按照目标对象原来的定位信息嵌入到原始图像,并使用图像融合算法对嵌入区域进行处理,使得融合更加平滑和自然。现有的研究都是针对各个领域独立进行的,整合性的研究相对较少。在实现具体的目标风格迁移任务中,需要实现速度和效果的平衡。针对山水画风格迁移中各个子任务的技术要求,本文实现了基于Mask R-CNN的目标风格迁移算法。本文的主要研究工作如下:(1)首先对经典的目标检测算法,R-CNN、Fast R-CNN、Faster R-CNN等进行系统研究,最终以Mask R-CNN算法框架为基础,实现目标风格迁移。在此,对其核心原理和算法流程进行介绍,并对Keras和TensorFlow学习框架进行学习,详细研究了Mask R-CNN的代码实现及其关键步骤。基于Mask R-CNN算法实现对输入图像中目标对象的类别信息、定位信息以及空间布局像素信息的、快速、有效提取,同时,加入图像预处理,利用图像分割、灰度处理等预处理方法进一步提高本文效果。(2)针对目标对象的风格迁移任务,本文基于卷积神经网络的山水风格迁移方法,实现将内容图像中的目标对象区域转换成带有特定风格的图像,并对其图关键步骤进行详细描述。首先利用VGG19网络进行特征提取,从高层提取内容特征,低层提取纹理特征,实现特征获取,其次,根据迁移图像和风格图像,内容图像指定的层数计算风格、内容损失函数,进而得到总体损失函数,最后定义新的优化器,并调整参数训达到最好的效果,同时,基于MS COCO数据集生成风格迁移模型,最终,实现目标对象更高效的快速风格迁移。(3)针对图像风格融合任务,本文通过分析不同的统计因素对融合效果的不同影响,设计提出了二阶段的图像融合方案。首先,通过匹配样式统计信息实现具有初步融合设计,其次,设计初步融合+视觉精调的模型改进融合效果,以及图像灰度化处理,最后,通过重新设计样式向量传输的标准并修改损失函数的计算方法提高了图像风格重建的质量。
其他文献
脉冲光纤激光器因为拥有成本低、转化效率高、兼容性好等优势而受到人们的广泛关注。在光纤激光器中利用可饱和吸收体的强度调制能力是实现脉冲输出的重要方法。目前在光纤激光器中应用较为成熟的可饱和吸收体是半导体可饱和吸收镜。但是它有造价高、可调带宽小、易被损伤等缺点。最近几年,大量制作工艺简单、成本低廉、性能良好的低维材料因为其良好的光学强度调制能力而逐渐引起人们的关注。但是,找到一种调制能力强且工作状态稳
EPS泡沫轻质土作为一种新型岩土工程填充材料,近年来被越来越多的应用于桥梁台背回填、铁路路基、道路软弱地基、边坡工程等实际工程应用中,具有轻质高强、节能环保、便于施工等优点。为了更好的研究EPS泡沫轻质土的性能,本文针对标准砂与EPS泡沫混合轻质土,开展了一系列的室内固结排水三轴剪切试验,全面系统的研究了未加固轻质土与微生物加固轻质土的强度与变形特性,分析了EPS含量、围压、加固程度等因素对轻质土
经过四十年的改革开放的快速发展,中国城市发展即将进入稳定阶段,新时代城市发展应该满足人民生存、享受以及发展需要,满足老百姓对美好生活的追求,从城市“数量增长”转向“提升品质”。品质的好坏具有相当的主观性和个人化色彩,是感性的,其核心是人的感知,是不同主体存在多元的品质需求。将个体真正的需求视为品质,打造多元化、多层次的“居民可感知”的品质城市,而听觉是仅次于视觉感知的人类重要感知之一,城市可感知声
随着互联网科技的革新与发展,信息的交流达到了空前水平。同时也带动了存储技术的飞速发展。各行各业对存储设备提出了较高的要求。为了满足各种系统所提出的不同要求,发展一种大容量、高速度和低功耗的新型存储器成为目前科学研究的焦点之一。相变存储器(PCRAM)由于其高集成度、高读写速度、低工作电压和低功耗等优点,在存储领域有着广泛的应用。PCRAM的核心是以硫族化合物为基础的相变材料,主要有 GeSb、Sb
本文采用简单的水热法分别制备暴露{111}晶面的MnO八面体和暴露{001}和{010}晶面的SnxTi1-xO2-TixSn1-xO2准同型相界复合纳米片,对它们进行通氢处理,得到氢化后的MnO八面体和SnxTi1-xO2-TixSn1-xO2准同型相界复合纳米片,并对氢化后的样品采用透射电子显微镜(TEM)、多功能成像光电子能谱仪(XPS)、红外光谱仪(IR)、X-射线衍射仪(XRD)和场发射
随着汽车工业的飞速发展和汽车的日益普及,人们对汽车行驶过程中的安全性和驾驶体验提出了更高的要求,因此提升汽车的舒适性和安全性成为了现代汽车技术研究中的两大重要发展方向。车辆的转向系统和悬架系统在改善车辆侧向稳定性、侧倾稳定性和行驶平顺性方面发挥着尤为重要的作用,然而作为汽车底盘中的两个子系统,二者存在着动力学上的相互耦合关系,因而存在着系统间的协调控制问题。本文以分布式驱动电动汽车的主动悬架系统和
创新驱动作为经济发展的主力军,对行业市场竞争起着决定性作用。十九大报告中也强调我国在2035年将进入创新型国家前列,2050年成为世界强国。支柱性的建筑业必须在创新型国家的建设中担当重任,在新常态下建筑业必须走创新驱动发展之路。然而,在资源要素约束条件下,作为劳动密集型的建筑业如何依靠创新驱动实现转型升级和可持续增长,成为行业必须面临的问题。论文结合我国建筑业创新驱动能力现状,运用随机前沿(SFA
气敏传感器(Gas sensor)可以针对特定气体,在不同浓度下进行有规律的响应,相对传统的气体检测方法,其检测更加迅速、便捷,安全、廉价。经过近几十年的发展,气敏传感器已经被广泛应用于工业、农业、医疗健康等方面。相对于传统的单一金属氧化物气敏传感器,多元金属氧化物具有工作温度低、气体选择性好、性能稳定以及检测限相对较低等优势。其中,多元金属氧化物铁酸铜(CuFe2O4)因其在气敏传感器的抗湿性、
高分三号卫星是我国首颗分辨率达到1米的C频段多极化合成孔径雷达(Synthetic Aperture Radar,SAR)卫星,具有十二种工作模式。高分三号卫星还是我国第一颗被设计使用8年的低轨遥感卫星,能提供长时间并且稳定的数据服务,在各领域已经有广泛的应用。高分三号SAR图像道路检测是高分三号应用的一个重要组成部分,对地图更新、目标识别、影像匹配等方面具有重要的辅助意义。但是由于相干成像机理,
NO2作为一种常见的空气污染物,危害生态环境并威胁着人们的健康。因此,对NO2气体进行有力检测与监控变得尤为重要。气体传感器能够有效监控环境中的有毒有害气体。其中,金属氧化物半导体气体传感器因其具有响应速度快、灵敏度高、重量轻、成本低等优势而被广泛应用于NO2气体的监测。目前,研究者们致力于研究各种不同金属氧化物材料对NO2气体的响应性能。在各类传感材料中,In2O3具有宽带隙、低电阻率和较好的化