基于深度信息的多视点视频编码及图像增强技术研究

来源 :武汉大学 | 被引量 : 4次 | 上传用户：jiajia0321

【摘要】

：

立体视频能够模拟自然景物在人眼中的呈现过程,满足了人们在观看视频时的临场逼真感需求,近年来在各行各业里得到了广泛的应用。立体视频包含多种表现形式,其中自由视点视频(

【作者】

：

胡金晖

【出处】

：

武汉大学

【发表日期】

：

2014年01期

【关键词】

：

自由视点视频多视点加深度视频格式 Kinect深度图像深度视频编码多视点视频编码低光照图像增强

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

立体视频能够模拟自然景物在人眼中的呈现过程,满足了人们在观看视频时的临场逼真感需求,近年来在各行各业里得到了广泛的应用。立体视频包含多种表现形式,其中自由视点视频(Free-view video, FVV)增加了立体观赏角度并提升了交互性,已成为目前的研究热点。MEPG在2007年将多视点加深度视频(MVD)作为自由视点视频的数据格式。其大幅减少了所需编码传输的视点数目,在解码端借助基于深度的虚拟视点绘制技术推导出任意视点的虚拟视频。相比2D视频,多视点加深度视频包含的视点数目显著增多,且深度信息的引入为MVD的编码及图像处理带来了新的挑战和机遇。第一,描述场景三维结构的深度信息的高质量获取是前提。近年来利用Kinect来主动实时获取深度信息成为了趋势,但由于场景遮挡、特殊表面等因素的影响,其获取的深度图存在深度值丢失的区域,影响了深度图的质量及合成虚拟视点的效果。因此,研究设计高效的深度图的空洞填充方法,提高获取的深度图的质量对于提升立体视频对真实世界的表现能力至关重要；第二,多视点加深度视频视点数目的增多带来了数据量的急剧上升,亟需高效压缩。一方面,由于深度图像并不是用来显示且统计特性与传统的2D图像不同,传统的视频编码方法压缩深度图像会造成边缘信息的损失,降低了合成视点的质量；另一方面,传统的多视点视频编码的视点间预测方式延用了时域上的线性运动模型,对于视点间存在非线性运动的情况缺乏表达能力,并不能高效去除视点间视频内容的冗余,制约了预测效率的提升。因此,根据多视点加深度视频的特性,研究设计多视点加深度视频的高效编码方法,在提高编码效率的同时提升合成虚拟视点的质量至关重要；第三,在多视点视频监控应用中,低光照环境下拍摄的图像噪声多且对比度低,亟需进行增强。传统的低光照图像增强方法主要是利用2D图像本身的信息进行增强,可利用的信息有限且增强后的图像丢失了深度感知,相关研究指出深度感知在人眼对图像的感知体验中起到重要作用。深度图像和彩色图像是从不同的角度对同一场景的描述,深度图像可从空间信息的角度对监控场景进行了描述,且其成像过程不易受环境和摄像机器件噪声的影响,为低光照图像增强提供了鲁棒的参考信息。因此,研究利用深度图的特性来增强低光照图像的质量,提升增强后图像的深度层次感至关重要。针对以上三个方面的需求与挑战,本文对基于深度信息的多视点视频编码及图像增强技术开展了研究,在深度图像的空洞填充模型、MVD中深度视点及纹理视点的编码方法以及基于深度信息的低光照图像增强模型等方面取得了以‘下创新性成果：(1)基于相似约束稀疏表示的深度图空洞填充技术针对现有深度图空洞填充方法易受到不相关非空洞点影响,导致边缘填充不准确的问题,本文利用稀疏编码的策略,基于彩色图信息,提出了基于相似约束稀疏表示的空洞填充模型。通过构建相似约束的稀疏表示目标函数来满足在周围像素对当前像素所表示误差最小的情况下,选择较少的与当前像素相似的周围像素来进行表示,以计算得最优的权重向量。相对于对比方法,本方法填充后的深度图的边缘轮廓更加接近于彩色图像的边缘轮廓,且边缘更加平滑清晰；并且在公开数据集上的图像中人工添加空洞后进行测试,本方法填充空洞后的深度图的整体质量提升了1.8dB。(2)基于结构张量环路中值滤波的深度视频编码技术针对现有基于滤波的深度视频编码方法滤波系数精度易受到纹理编码噪声、深度突变点以及纹理细节映射的影响,制约编码效率及合成视点质量提升的问题,本文利用结构张量分析工具,提出了基于结构张量的环路中值滤波模型,该方法联合纹理图像构建当前深度像素的结构张量,通过对结构张量的分析划分出与当前深度像素处于同一深度平面的区域,称为可信深度邻域,该区域包含了可信候选深度像素。然后将可信候选深度像素的深度值的中值作为最终的输出。相比于对比方法,本文提出的算法可以将深度视频的编码码率进一步降低约10%以上,且合成的虚拟视点的主客观质量更高。(3)基于自适应学习的视点合成预测多视点视频编码技术针对现有多视点视频编码视点合成预测方法的预测效率易受到深度失真及视点间光照色度差异影响的问题,本文提出了基于自适应学习的多视点视频编码视点合成预测技术。在合成当前帧的虚拟视点帧时,前一帧及其虚拟视点帧已经得到,本方法通过学习前一帧与其虚拟视点帧之间的差异关系来改善当前帧的虚拟视点帧的合成质量。相对于现有的视点合成预测编码方法,本方法合成的虚拟视点帧的质量最高可增加3.42dB,在编码方面,本方法平均可以降低约11%的码率,具有更高的编码效率。(4)基于深度感知的低光照图像层次增强技术针对现有低光照图像增强方法使增强后的图像丢失了整体深度感知的问题,本文根据深度图反映了场景的空间信息且其成像过程不受低光照环境噪声影响的特性,提出了基于深度感知的低光照图像层次增强技术,利用深度信息来辅助提高低光照图像的去噪及对比度拉伸的质量。构建了基于深度约束的非局部均值去噪模型,基于深度感知的低光照图像全局及局部对比度拉伸函数,相对于对比方法,本文提出的方法有效提升了增强后图像的深度层次对比度及边缘质量,且去噪效果提升了0.4dB。综上所述,本文通过分析深度图像的特殊统计特性及与纹理图像的结构相似性,将深度信息引入多视点视频编码及图像增强中,分别提出了基于相似约束稀疏表示的深度图空洞填充方法,基于结构张量环路中值滤波的深度视频编码方法,基于自适应学习的视点合成预测多视点视频编码方法,基于深度感知的低光照图像层次增强技术,进一步挖掘了深度信息的应用潜力,提升了多视点及深度视频的编码效率及图像增强质量。

其他文献

搜索下载转换一个软件搞定网络视频

你是不是和我一样喜欢观看各大视频网站的热门视频，但苦于没有时间挂在网站上搜索欣赏昵？你是不是想把它们快速下载回来放到手机或MP4中在上下班的路上慢慢欣赏呢？这款“波波虎

期刊

网络视频下载搜索软件MP4网站欣赏

提前告知随堂小测验对消化内科临床见习阶段小讲课教学效果的影响

目的：探讨提前告知随堂小测验方式对消化内科临床见习阶段小讲课教学效果的影响。方法：选择在本院消化内科临床见习阶段学生,分为提前告知组和对照组。比较两组的课堂情况和随

期刊

内科教学法临床见习消化内科

审计监督和高管薪酬差距与国有企业风险

高管薪酬差距激励了公司业绩,但是对国有企业而言,持续稳健的经营往往比短期的业绩增长更为重要。高管薪酬差距增加了国有企业领导人员的机会主义动机,促使其通过推动高风险

期刊

审计监督高管薪酬差距国有企业风险

幸运光环下的双修召唤—《奇迹世界》单刷之王

说起《奇迹世界》里的召唤圣射手，这个让人觉得冷门的职业的确不如大热职业的狂战士、龙骑士、魔法师那么受人瞩目。抛开另外三个职业，单是同门比拼，射手中的敏体，战斗也比召唤名

期刊

世界光环职业射手

江西信息通信业全力保障疫情防控期间“停课不停学”

为认真落实工业和信息化部关于疫情防控期间宽带网络助教助学和“停课不停学”工作部署,江西省通信管理局联合省教育厅建立工作协调机制,组织基础电信企业依托优质网络资源和

期刊

省通信管理局疫情防控信息通信业网络资源工业和信息化部工作协调机制大数据技术宽带网络

漫谈我国早期的动画艺术教育

中国的动画艺术在国际上曾闪烁出耀眼的光芒。从《谢谢小花猫》到《乌鸦为什么是黑的》,短短的6年,老一辈艺术家创作的动画片已经在国际舞台上崭露头角。从《骄傲的将军》到

期刊

卡通训练班苏州美专动画科

基于图像集合和视频序列的视频人脸识别算法研究

本文以视频人脸识别问题为中心,阐述了视频人脸识别的研究背景及重要意义,从基于关键帧的视频人脸识别方法、基于图像集合的视频人脸识别方法以及基于视频序列的视频人脸识别

学位

计算机视觉视频人脸识别Gabor变换多示例学习局部二值模式核函数凸包模型样本选择

广东省纺织服装出口贸易现状、瓶颈及对策

伴随着国际市场需求不足,国内成本不断上升,我国纺织服装业的重要生产基地——广东省,以质优价廉享名海内外,十多年来一直是我国国服装出口贸易第一大省。2013年至2018年,广

期刊

广东省纺织服装出口贸易

基于AHP的新疆旅游文创产品开发类型优化研究

近年来,"文创产业"正在迎来发展热潮,在进一步激发文化和旅游消费潜力的政策指导下,如何从供给侧做好旅游文创产品的开发尤显重要。伴随着新疆旅游业的迅速发展,势必需要丰富

期刊

AHP模型旅游文创产品开发类型

基于体验感知角度的乡村旅游吸引力研究综述

随着乡村旅游的兴起,乡村地区被无序开发,造成乡村景观同质化、乡村旅游格局混乱、旅游吸引力被削弱等一系列问题的衍生。现首先回顾国内外乡村景观旅游吸引力的发展过程,并

期刊

乡村景观旅游吸引力体验者感知Rural landscapetourism attractionexperiencer perceptionresearch

基于深度信息的多视点视频编码及图像增强技术研究

与本文相关的学术论文