平面与立体图像重定向方法研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:cyt200388
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字媒体技术的发展,不同尺寸的2D和3D终端显示设备越来越多地被人们使用。为了在不同设备中保持理想的视觉质量,需要合适的图像尺寸调整方法。因此,图像重定向成为图像处理领域的热点问题。大多数基于内容感知的图像重定向算法只考虑了图像的低层特征,而忽略了重要的高级语义。此外,与2D图像相比,3D图像增加了额外的深度信息,如何在重定向过程中保持3D图像的立体感成为关键问题。因此,需要准确提取2D和3D图像的高级语义特征以及3D图像的立体特性,对基于深度学习的平面与立体图像重定向方法展开研究,提升用户的视觉体验。本学位论文主要包括以下两个方面的内容:(1)针对平面图像,本学位论文提出了一种特征域可缩放感知及细缝裁剪的图像重定向方法。首先从预先训练的VGG-19网络中提取输入图像的深度特征图,计算最深层特征图像的可缩放率;然后根据计算的可缩放率,采用基于特征域的细缝裁剪方法对最深层特征图像进行处理;再依次向浅层传播,得到所有特征层的重定向图像后,将输入图像对应于第一层特征图去缝位置处的像素去除,可得到初步的重定向结果。若未达到目标尺寸,再进行均匀缩放操作,从而得到图像最终的重定向结果。在RetargetMe数据集上分别进行主观与客观评估,结果表明,与其他方法相比,该方法可以更好地保存输入图像中的重要对象,在内容与结构保持等方面具有优势,总体上实现了更好的性能。(2)针对立体图像,本学位论文实现了一种基于卷积神经网络的内容感知与视差优化的立体图像重定向方法。该方法利用深度学习训练出一种重定向模型(Retargeting Model,RM)来实现立体图像重定向。首先通过前向重定向得到左右图像的重定向结果;然后通过后向重定向对前向重定向的结果进行复原;最后利用内容感知一致性与视差一致性约束对RM进行优化。整个重定向过程不需要任何监督,输入任意大小的左右图像和期望的宽高比,可以直接生成视觉上令人满意的目标图像。实验结果表明,该方法能够较好地保留输入图像中视觉感兴趣的区域,防止目标图像的严重失真和伪影并使视差得到保持。
其他文献
近些年来,集成光子学理论与技术蓬勃发展,相关光子器件的研究也层出不穷。硫系材料具有超快的非线性响应、超宽的红外透过范围、超高的三阶非线性折射率以及极小的双光子吸收等优点,使其在红外光子领域具有广阔的应用前景,同时其波导制备能与传统CMOS工艺相兼容,进而产生了“硫系光子学”这一热门的研究方向。硫系光子学的研究主要分为三个方面:硫系基质材料的性能研究及优化、光子器件的设计与制备以及光子器件的应用。其
学位
在一个大型无线传感器网络中,传感器选择对于目标定位而言是十分必要的。本文针对基于信号到达时间差(Time-Difference-of-Arrival,TDOA)目标定位的传感器选择问题做出了研究,提出了两种方法用以建立选择传感器数量已知下的传感器选择问题:⑴基于TDOA测量模型引入一个三态向量作为优化变量建立传感器选择问题,并通过数学运算将该传感器选择问题等价转化为以一个布尔向量作为优化变量的传感
学位
在椭圆拟合中,由于物体遮挡、镜面反射或物体自身结构等原因,通过边缘检测技术所得到的数据点往往存在野值,而在这种情况下,椭圆拟合的性能会显著降低。因此,研究能够应用于现实生活的鲁棒椭圆拟合方法具有重要的意义。本文重点研究了对野值具有鲁棒性的椭圆拟合方法,并将所研究的方法推广到耦合椭圆中。本文的主要工作如下:(1)基于高斯核函数和拉普拉斯核函数的最大熵准则(Maximum Correntropy Cr
学位
频率选择表面(FSS)是周期性的二维或三维结构,具有对不同频率、极化方式和入射角度的电磁波有选择性透射或者反射的性质,在通信、雷达系统和隐身技术等方面有着广泛运用。本文所设计的多频段频率选择表面可运用在多频通信、雷达系统中,提高系统灵活性,宽带频率选择吸波器在军事隐身技术中有很好的应用前景。本文主要对多频段频率选择表面和宽带吸波器进行研究,主要工作由以下组成:(1)从频率选择表面的基础和理论出发,
学位
中红外波段位于大气传输窗口,覆盖了众多分子和原子的吸收或振动能量带,在红外传感、军事对抗、生物医疗及环境监测等领域应用普遍。随着中红外激光技术的迅猛发展,市场对激光器件提出了更高的要求,探索小型化和集约化于一身的激光器件成为该领域亟需解决的问题。因此具有高集成化、便捷、低成本等优点的中红外光纤激光器显示出潜在的应用前景,并引起研究者的极大关注。硫系玻璃光纤具有低声子能量,宽红外透过范围及高折射率等
学位
集成光学器件具有很多优良特性,如带宽高、传输速度快、尺寸小、功耗低、兼容性好,在通信技术的发展中扮演着重要的角色。集成光学技术是波导技术与光科学的融合,因此光波导是集成光学器件的关键。硒化锌(ZnSe)作为一种化学性质稳定的金属硫族化合物,不仅具有宽的透射范围,同时具有良好的非线性光学性能,这些特性使ZnSe成为制作波导元件的理想材料。目前国内关于ZnSe光波导方面的研究较少,制备工艺不够成熟,大
学位
近年来,随着生物医疗、物联网(Internet of Things,Io T)、可穿戴设备以及无线传感网络等领域的蓬勃发展,集成电路占据了很大一部分市场。芯片的功耗和能耗成为工业界与学术界日益关注的焦点之一。近/亚阈值电路设计通过降低电源电压来降低电路功耗,使系统功耗下降,这在低功耗设计中是一个很大的优势。超大规模集成电路设计通常采用基于标准单元库的半定制设计方法,标准单元库的优劣直接影响到芯片的
学位
微环谐振器作为光子集成技术中最为基本的构建模块之一,在光运算、光调制、光开关、光传感等领域均具有非常广阔的应用前景。作为一种微型光学谐振腔,微环的结构简单紧凑,不需要借助额外的反射镜便可将光场囚禁于微纳米尺度量级,光场在如此狭小的区域内循环往复谐振增强后,能够显著增强与外界待测物质间的相互作用,从而大大提升传感的灵敏度与检测极限。近年来基于微环的光学传感装置已成为光子技术研究领域的热点,大量基于此
学位
近年来,随着移动通信技术的快速发展,人们对频谱资源的需求日益增加,频谱资源短缺的问题越来越突出。认知无线电(Cognitive Radio,CR)是解决此问题的关键技术。CR通过机会式接入空闲频段,能够对频谱资源进行动态管理,从而提高频谱资源利用率。作为CR的核心技术,频谱感知技术是区分CR是否具备认知能力的关键。本文研究基于粘性隐马尔可夫模型(Sticky Hidden Markov Model
学位
传统基于人类视觉感官进行主观判断的图像评价方式虽然有较为准确的评价效果,但往往费时、费力且不易集成,所以质量评价的研究往往以建立符合人类主观意见的客观模型的研究为主,客观模型的预测应当在单调性和秩序性上与人类主观意见保持基本一致。本文中所提模型采用皮尔森相关系数和斯皮尔曼秩序相关系数两个重要参数来说明模型预测是否符合人类主观的意见。论文主要从深度网络特征这个出发点进行延伸,分别从图像深层特征相似性
学位