基于结构表达与推理的大面积受损图像修复技术研究

来源 :武汉大学 | 被引量 : 2次 | 上传用户:xhb74
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字图像修复的目的在于使用一种自动的数字图像处理技术对图像中的缺失区域进行填充,保持缺失区域与已知区域的连贯性和自然过渡,使得填充后的图像满足人类视觉要求。随着信息时代的发展,数字图像修复技术已成为计算机视觉和数字图像处理领域的前沿性研究课题,在文物保护、生物医疗、游戏娱乐等领域得到了广泛的应用。
  传统基于信息扩散或基于纹理合成的图像修复方法可在细小区域或重复纹理缺失区域取得良好的效果,但当图像内缺失区域面积过大时往往生成模糊或单一的修复结果。近来发展起来的基于深度学习的图像修复方法可通过理解受损图像内容从而对缺失区域内容进行推理生成,在人脸、车辆等特定场景中可生成较准确的图像语义,但直接将这类方法推广到包含复合结构和纹理的自然图像修复场景时,仍存在许多巨大的技术挑战。具体分析如下:
  (1)内容生成方面:自然场景图像由于对象类型多样、像素分布情况复杂,现有采用单次前向生成图片的方法生成的内容往往存在严重的形状失真和纹理混叠的问题,尤其发生在对象边界与纹理多变区域。然而,图像中不同对象的同质纹理区域交接处往往会形成丰富的结构信息,是一种良好的先验知识,有利于这种“一对多”的不适定问题的求解,因此如何对结构信息进行推理并利用结构先验辅助图像修复是解决形状失真的重要问题。
  (2)纹理优化方面:基于深度学习的图像修复方法通常采用修复图和原始图在像素层或特征层的重建损失(L1或L2损失)作为网络模型的优化函数,而重建损失已被学术界公认会造成生成内容的纹理模糊现象,即使结合以保证图像“自然度”为优势的生成对抗损失,也难以取得比较满意的效果。然而,受损图像中的已有信息具有完好且丰富的图像纹理细节信息,如何借鉴这一重要的纹理先验知识,保持缺失区域生成内容的纹理细节与已有信息的一致性,是图像修复领域需要解决的问题。
  (3)语义感知方面:现有方法采用残差网络、扩展卷积和跳跃连接等工具,结合重建损失、生成对抗损失等约束条件,能使图像整体修复质量有所提高。但自然图像中存在多个对象,而不同对象间的结构属性不尽相同,纹理细节的修复机制也各不相同,增加语义先验有助于提高复杂场景对象结构与纹理修复的准确性。而修复图像中语义对象的位置推断又依赖于修复后的图像内容。因此如何协同实现对图像中语义对象位置和图像内容及细节的推理,使这两个任务相辅相成,是图像修复领域又一需要解决的问题。
  针对上述三大挑战,本文借鉴人类艺术家在修复图像首先对结构进行勾勒和恢复的思路,以图像结构为主要研究对象,逐步引入结构先验信息、纹理先验信息和对象语义先验信息,分别从结构推理与辅助修复、结构约束下的纹理迁移、语义与结构的联合优化三个层次展开研究,取得了以下创新性成果:
  (1)基于显式结构推理和感知的图像修复技术
  针对现有图像修复方法依赖单一高维特征无法表达复杂自然场景,易导致图像修复结果边界不准确的问题,本文提出了一种基于显式结构推理和感知的图像修复技术。通过显式提取受损图像的边缘获取图像结构信息,并在结构高层语义特征表达的基础上构建结构修复模型,生成完整边缘图像,为缺失区域的恢复提供结构先验信息来改善修复结果目标边界处的质量。相对于基于整体图像内容理解的图像修复方法,本文提出的算法可有效提升修复目标边界的准确性,且可将修复图像的平均PSNR提升1.27dB。
  (2)基于隐式内容推理和风格渲染的图像修复技术
  针对现有图像修复算法由于神经块单元混合了结构和纹理信息,在通过神经块单元匹配的纹理优化过程中易导致图像内容被误改的问题,本文提出了一种基于隐式内容推理和风格渲染的图像修复技术。通过将图像的结构和纹理特征分别映射到内容隐空间和风格隐空间实现两者的分离,并在阐明缺失区域结构推理与纹理填充机理具有本质差异的基础上,构建隐空间的内容推理方法和基于已知区域纹理先验的风格渲染方法,从而从根本上解决了内容推理与纹理优化之间的矛盾。本文提出的算法与基于纹理优化的图像修复算法相比,可将修复图像的平均PSNR提升0.38dB。
  (3)基于对象感知和多任务递归学习的图像修复技术
  针对现有基于生成的图像修复模型在多目标修复的复杂场景中对各语义对象的表达能力不足而导致生成无效语义图像内容的问题,本文提出了基于对象感知和多任务递归学习的图像修复技术。通过引入图像中对象语义先验信息为缺失区域的结构修复和纹理填充提供指导,在分析语义对象分割与图像内容修复之间相互依赖关系的基础上,构建图像语义分割与图像修复的多任务递归学习框架,从而实现基于语义先验信息的图像修复质量提升。本文所提算法相比于现有基于纹理优化的图像修复方法可提升0.57dB。
  综上所述,本文通过分析结构在人工图像修复过程中的重要性,从图像结构的表达与推理入手,分别在显式结构的提取与推理、隐式结构的表达与推理、基于语义约束的结构推理三个层次上逐步引入结构先验、纹理先验和语义对象先验信息,提出了基于显示结构推理和感知的图像修复方法、基于隐式内容推理和风格渲染的图像修复方法和基于对象感知和多任务递归学习的图像修复方法,大幅提升了复杂自然场景的图像修复质量,为图像修复技术从特定场景向通用场景的应用奠定基础。
其他文献
昆虫的变态发育是昆虫与环境长期适应、协同进化的结果,受激素、营养和基因的精确调控,在此过程中有多重因子协同发挥作用。近年来,非编码小分子RNA(microRNA)在昆虫中的研究表明,其对昆虫的变态发育具有显著的调控作用。但在模式昆虫赤拟谷盗中,对microRNA参与发育事件的研究仍鲜有报道,对其具体的调控机制也需要进一步阐明。本论文中利用miRNA类似物、双荧光素酶报告实验、双链干扰以及解剖学观察
学位
中性粒细胞是高等动物血液中数量最多的白细胞,在天然免疫中发挥着重要作用。中性粒细胞胞质中富含颗粒,颗粒中含有多种可消化微生物的蛋白酶。当机体遭受外来微生物侵袭时,中性粒细胞是最先响应并到达感染部位的免疫细胞,并通过噬菌作用,脱颗粒作用,和中性粒细胞胞外杀菌网络消灭外来病原体。中性粒细胞的正常发育对机体抵抗感染、维持稳定起着非常重要的作用。  中性粒细胞的形成、分化、成熟过程受到很多基因的调控,若受
目的明确中性粒细胞弹性蛋白酶抑制剂Sivelestat对非酒精性脂肪性肝炎(nonalcoholic steatohepatitis,NASH)的防治作用及可能机制。方法 4周龄雄性C57BL/6J ApoE-/-小鼠40只分为:⑴正常饮食(Standard chow,SC)+生理盐水组,⑵SC+Sivelestat组,⑶高脂高胆固醇饮食(High-fat high-cholesterol,HFH
以丙烯酰胺、丙烯酸和2-丙烯酰胺-2-甲基丙磺酸为聚合单体,N,N-亚甲基双丙烯酰胺为交联剂,过硫酸铵为引发剂,利用自由基溶液共聚法合成了一种聚合物凝胶P(AM-AA-AMPS),利用环境扫描电镜表征了其微观形貌,借助微流变仪定性定量研究了P(AM-AA-AMPS)成胶性能的影响因素。结果表明:聚合物凝胶成胶时弹性因子(EI)和宏观粘度因子(MVI)急剧增大,成胶后的EI和MVI值趋于稳定。在一定
目的了解孕妇和新生儿维生素 A(VA)营养状况及对婴幼儿生长发育的影响。方法随机调查重庆铜梁县三所医院健康待产妇女及其新生儿维生素 A 水平;随访上述儿童体格及智力发育情况。结果共调查 143例孕妇血清 VA 水平为(1.05±0.350)μmol/L,新生儿脐血 VA 水平为(0.71±0.155)μmol/L,孕妇亚临床维生素 A 缺乏(SVAD)检出率为17.0%,可疑 SVAD 为33.3
The mural paintings in Mogao Grottoes have high historical, artistic and cultural values. In the course of thousands of years, they have been affected by various natural and human factors, resulting i
会议
随着人工智能、传感器、自动化和人与自然交互等重大前沿技术的发展,迫切需要攻克复杂环境感知技术。激光3D图像传感器因测量精度高、方向性强、响应速率快和不受地面杂波影响等优势,是无人驾驶汽车等领域首选的专用传感器之一。微机电系统(MEMS)扫描激光三维图像传感器因MEMS微镜具有轻量化、速度快、低成本等优点,备受国内外高度关注,它将是克服传统机械转式激光3D图像传感器诸多缺陷最有前途的技术路线之一,也
Based on the control principle of the dry plastic film laminating machine, and the linear velocity synchronization and variable tension control in the winding process for the two-layer film laminating
移动业务类型的拓展和智能终端数量的增加对无线空中接口容量的扩展提出了前所未有的挑战。作为扩展通信容量的有效途径之一,开拓包括毫米波在内的高频段频谱资源受到了学术界和工业界的广泛关注。为适应毫米波通信路径损耗大、角度稀疏等传输特性,在通信收发两端通过架设大规模天线阵列获取大的波束增益以补偿路径损耗显得不可避免。然而,随着天线数量的剧增,传统的角度估计方法因其巨大的估计开销而不再适用。为减少角度估计的
第五代移动通信系统(5G)对频谱效率(Spectrum Efficiecy, SE),能量效率(Energy Efficiecy, EE),网络成本,传输时延等性能都提出了更高的要求。为了有效应对上述挑战,5G系统将云接入网络(Cloud Radio Access Network, C-RAN)作为关键的备选技术。在C-RAN中,基带处理部分被聚集并且共享在一个虚拟的基带单元池(Base Band