基于改进U形卷积神经网络的图像合成方法研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:abczxhzxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像合成是使用某种形式的图像描述信息生成真实感图像的过程,基于深度学习的图像合成方法使用现有数据集训练深度网络学习合成对应图像的方法。而U-Net是深度学习中一种常用的卷积神经网络结构,主要用于医学图像分割。本文将U-Net应用于图像合成领域,并针对U-Net在图像合成应用上存在的缺陷进行了相应改进。本文的研究内容如下:首先,为了增加网络的参数容量,本文将DenseNet中的密集连接结构与ResNet中的残差结构引入到U-Net中,并结合两者提出了密集残差模块。通过引入密集连接和残差结构,U-Net的网络参数容量得大幅提升,网络中特征图的利用率得到了提高,网络可以学习到更多特征,生成更具细节的图像,同时也保持了网络的训练与预测效率。其次,为了提高卷积神经网络合成图像的质量,本文使用缩放卷积替换了U-Net中使用的转置卷积。U-Net中使用转置卷积对特征图进行升维,但转置卷积会对合成图像的质量造成一定影响,导致合成图像中出现不同程度的棋盘格状伪影。本文中使用的缩放卷积在一定程度上消除了合成图像中存在的棋盘格状伪影,提升了合成图像的质量。接着本文结合感知损失与Smooth L1损失函数通过有监督学习的方式对网络进行训练,使用感知损失可以使得网络学习到物体的抽象特征,而Smooth L1损失又可以对合成物体的细节,如颜色等,进行一定的限制。最后本文共进行了从语义图像到真实感图像和素描图像到真实感图像的两类实验,在Cityscapes,ZuBuD和CelebA三个数据集上的实验表明,在复杂的图像合成任务上,本文所提出的优化网络(IUNs)与CRNs相比在效率上有着明显优势,在合成图像的质量上也略优于CRNs,IUNs所合成的图像比U-Net所合成的图像具有更丰富的细节,且合成图像中的物体更加完整。而在简单的合成任务上,IUNs的表现与U-Net相近,但IUNs所合成的图像质量更高,合成图像中存在的瑕疵更少。综上所述,本文所提出的改进网络在合成效率与合成图像质量上达到了较好的平衡。
其他文献
实验目的神经母细胞瘤(Neuroblastoma,NB)作为一种儿童常见的颅外实体肿瘤呈高度恶性。Notch信号传导通路与NB的发生密切相关,Notch活化复合酶(Notch activation complex kin
研究背景及目的:2,2,6,6-四甲基哌啶氮氧化物(Tempo)是小分子氮氧自由基,带有一个单电子,既具有还原性又具有氧化性。它有细胞穿透作用、低毒、无致癌及致突变作用。在低浓度
随着网络技术及网络应用多样化的快速发展,网络规模和结构日益复杂。用户通过无线网接入有线网络的业务需求日益增强,同时对混合网络性能提出了更高的要求。混合网络的异构性
研究目的肾脏是由21种类型细胞组成的复杂器官,在维持机体内环境的稳态中起着重要作用。肾脏具有一定的自我修复能力,但由于其细胞类型多、结构复杂,参与肾脏修复的细胞类型
常德丝弦是中国十大地方曲艺之一,繁衍于民间、根植于群众、极具湖湘文化和荆楚文化,是祖祖辈辈流传下来的历史记忆。作为湖南曲艺类的重要学派,2006年入选第一批国家级非物
目的:运用血管内-中膜(intima-media thickness,IMT)自动跟踪技术结合声学密度定量技术(acoustic densitometry,AD)观测颈动脉孤立性斑块的生物力学特性,同期应用18F-氟代脱氧葡
本研究通过田野调查,对四川若尔盖热尔牧区话的语音、词汇、句子做了概括性描写研究。本文除前言外,主题内容分三个章节。第一章,热尔话音系。对采集的2000多条词汇和短语进行分析和统计,归纳出热尔话的音系。对声母、韵母、音节结构逐一举例,并加以分析和特征描述。热尔话虽有习惯调,但作为语义区别特征的声调还不成熟。第二章,热尔话词汇特点。词汇部分主要从和书面语同源及非同源的词、借词、旧词、地方特色词汇方面描
转基因技术自问世以来就广受争议,由此也引发了转基因食品的标识之争。美国自上世纪90年代以来一直坚持自愿标识原则,但是随着消费者要求强制标识的呼声日益强烈,各州相继出
研究目的:有研究显示,在多种癌症中观察到不同类型肥大细胞的募集,暗示肥大细胞的募集与细胞因子的分泌与肿瘤微环境中血管新生相关。本课题组的前期研究发现,PKD2/3对前列腺
伴随着物联网和互联网应用的快速发展,网络中终端的接入数量正在急剧增加,同时随着技术的进步,单个终端能够支持的业务数量和对流量的需求也越来越高,由此带来的网络中传输的