基于多粒度特征融合的图像补全方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:xuguai19811025
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是21世纪最重要的信息传播媒介之一,具有简洁且迅速的视觉信息传达能力。图像补全是数字图像处理领域的一项重要研究内容,目前的研究方法大多基于深度学习构建模型。然而,现有的图像补全技术仍存在一些不足,一些方法忽略了图像的边缘结构信息,在补全大面积不规则的缺失图像时无法还原高清晰度的结果;普通的局部判别器只能输入规则的缺失图像,不能补全非矩形的缺失图像,不具有普适性;另外一些方法没有注重生成结果和背景图像的像素连续性,导致补全结果和背景区域之间产生色差。因此,构建一个满足像素连续性的、人眼视觉上真实的图像补全模型具有一定的现实需要。针对上述问题,本文一方面从图像结构信息中把握规律,结合多粒度认知计算的思想提出边缘判别器,将卷积过程中提取的不同大小的特征图视为不同的粒度层次进行充分学习,使得生成图像边缘与真实图像边缘更加相似,生成视觉效果上更加清晰的补全图像;另一方面利用梯度信息优化生成器和全局判别器,缓解生成图像和背景区域的色差问题。具体研究内容如下:1.本文提出一种基于多粒度特征融合的边缘判别器,在图像补全任务中利用卷积神经网络提取图像中的边缘信息,将不同层次的特征图作为不同粒度层次的特征,通过融合学习这些数据特征来还原数据在粗粒度层次的抽象表现,即图像边缘。2.在计算损失的过程中采用加权思想,边缘区域的像素值应具有更大的权重。即越靠近边缘权重值越大,反之越小。在图像中,梯度值大的点被判定为边缘像素点,因此本文将梯度值作为权重值,权重值的大小代表到边缘像素点不同的距离。3.针对补全结果的色差问题,本文对精细化生成器的部分卷积网络进行优化,利用图像梯度信息指导二值掩码的收缩,使得模型沿着图像梯度方向补全缺失图像,同时提出多级语义判别器,将梯度信息与整幅图像信息分别输入全局判别器,将图像卷积成十六分之一大小的特征图进行融合,使得模型更好地约束生成结果与背景区域的色差。实验表明,在补全大面积不规则缺失图像时,本文方法取得了比其他图像补全方法更好的效果。
其他文献
移动边缘计算通过在网络边缘部署大量服务器,为用户提供低时延、高可靠性服务的同时也在一定程度上解决了应用激增带来的资源短缺问题。随着越来越多的应用向网络边缘迁移,边缘服务器的部署和资源调度问题受到了极大的重视。因此,本文首先研究了协作式边缘服务器部署策略;在此基础上,研究了面向快速响应的资源调度策略。具体的研究成果如下:1.针对现有的边缘服务器部署策略未充分考虑服务器间协作的问题,本文根据基站与边缘
学位
用超速离心方法从感染流行性出血热(EHF)病毒的细胞培养液中浓缩和纯化了A9、Chen、76-118、R22、L99 5株病毒,对5株病毒进行的SDS-PAGE均显示了此病毒的G1、G2和NP 3个结构蛋白。3株野鼠型病毒A9、Chen、76—118株的结构蛋白分子量相同,两株家鼠型病毒R22、L99株的结构蛋白分子量相同,但两个不同血清型病毒间有所不同。用放射免疫沉淀(RIP)分析了16株EHF
期刊
语文“生·动”课堂是以“生命”“生活”“生成”为语文教学的基础,以“主动”“互动”“灵动”为课堂呈现样态的教学主张。“生·动”课堂有利于学生语文素养的培育和学习力的提升,可以通过激发生命热情,提升文字体悟力;走进生活世界,提升认知迁移力;促进优质生成,提升创新思维力;设计活动方式,提升学习辐射力等举措获得灵动的教学效果,达成以语育人、以文化人的目标。
期刊
图像以简洁、直观的方式传递出巨大的信息量,对海量图像数据的管理和高效检索成为一个具有挑战性的问题。图像检索最重要的步骤是特征提取与特征编码,深度卷积神经网络具有强大的特征提取能力,但其提取的图像特征维度较高,特征的存储和计算开销较大。哈希学习将图像数据映射为二进制编码,显著减少了内存消耗且检索速度较快。近年来,越来越多的学者开始将深度学习与哈希学习相结合,基于深度哈希的图像检索成为一个热门方向。本
学位
在计算机视觉领域,相较于人的指纹、虹膜等特征,人脸能够进行身份匹配且更易获得,因此人脸识别一直是当前研究的热点。近年来,大多数人脸识别算法基于数据驱动表现优异,然而在一些特殊应用场景中采集人脸多张样本是个难题。如在身份证管理系统、刑侦执法系统、护照验证和登记口身份识别等实际场景中,每个人的训练样本只能获得一张(摄像机拍摄的证件照图像),称这种情况为单训练样本约束。在单样本约束下,当测试人脸图像受到
学位
随着生活中智能化的程度越来越高,机器学习逐渐应用到了现代智能化生产中。在机器学习当中,深度学习是一个重要的分支,其中卷积神经网络被广泛应用于计算机视觉领域的研究,其性能的优劣直接决定了相关任务的好坏。随着对卷积神经网络准确度要求越来越高,模型也变得越来越复杂,所需的硬件资源也越来越昂贵。近年来对卷积神经网络的研究从构建高准确率的大型卷积神经网络逐渐转向了如何构建更加实用高效的轻量级模型架构。研究轻
学位
多目标跟踪技术与行人属性识别技术是计算机视觉领域中的两个重要分支,已经成功应用于智能安防、商业分析等领域。然而,多目标跟踪技术与行人属性识别技术往往是独立进行的,由于两者没有共享网络权重,因此存在参数量大、推理速度慢的问题。本文针对此问题,将多目标跟踪网络与行人属性识别网络进行集成,提出了多目标跟踪与角度识别一体化网络。在此基础上,本文将注意力机制引入多目标跟踪与角度识别一体化网络,提高了一体化网
学位
近年来,随着大数据的发展,汽车数据服务变得尤为重要。在当下,使用人工智能技术依靠汽车行业历史数据预测未来销量,可以为相关汽车企业和汽车政府机构提供强有力的数据支撑,对销量变化趋势进行展示及预警,以便相关人员及时制定政策、及时调整企业的内部调度,避免由于风险应对不及时带来的财产损失和行业动荡。所以构建模型实现销量预测技术是关键,但是当前的许多研究对于汽车销量预测存在着不够具体和精确的问题。由于乘用车
学位
随着现代通讯技术和交通设施的快速发展,交通设施使用者产生的数据呈现出一种爆炸式增长。不同城市和地区之间的人员来往产生了一系列的流动数据,通过对流动人口大数据的比对分析,尤其是地理位置、数据特征、居留意愿分析,可以比较清楚地看到人口流动的大致方向,从而把握流入地的产业结构组成和发展方向,达到完善人口流动机制、提高就业质量的目的,能更好地推动城市的服务管理。对国内人口流动特征进行可视化分析可以用于研究
学位
随着大数据时代的到来,人工智能技术在许多领域发挥了重要作用,与此同时,人工智能安全问题逐渐凸显。机器学习模型作为人工智能系统的核心,其安全性也成为工业界和学术界关注的热点。自对抗样本的概念提出以来,针对机器学习模型的各种攻击层出不穷,现有攻击算法无法很好地兼顾攻击成功率和样本视觉效果,为了达到较高的攻击成功率而不惜对原始图像进行大规模像素修改,导致最终生成的对抗样本失真。并且大多数情况下对抗攻击算
学位