三维视频深度图像的帧内编码算法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:netwanderchf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维视频以其独特的身临其境的视觉效果引起了消费类电子产业和广大消费者的兴趣,也激发了学术界的研究热情。多视角视频是一种三维视频表达形式,可以让用户在一定范围内自由选择观看视频场景的位置和角度,近年来得到了迅猛发展。但是多视角视频的数据量随着视角数目成比例增加,给三维视频的制作、存储和传输带来极大的负担。多视角加深度(Multi-view Video plus Depth, MVD)形式的三维视频通过附加的深度图像以及视角合成技术,可将有限视角的视频扩展到任意视角,成为目前最具潜力的三维视频表达形式之一。   深度图像的压缩编码是新一代三维视频编码标准的重要组成部分。深度图像具有明显的结构特征,将面向自然视频的视频编码国际标准H.264/AVC、HEVC中的帧内预测方法直接应用于深度图像并不能获得理想效果,尤其在任意形状的深度边缘处,较大幅值的预测误差不但会增加变换域系数而耗费较多的比特进行编码,而且会在重建的边缘形成明显的振铃效应,严重破坏了合成视角视频的主客观质量。本文在传统的帧内编码框架下,根据深度图像的特点,对深度图像的帧内编码算法进行研究和改进。本文的主要工作以及创新之处在于:   1.在H.264/AVC框架下实现了一种基于边缘自适应的帧内编码算法。该算法首先沿着深度边缘在16×16宏块或8×8块中提取一系列4×4子块,形成一种灵活的块分割方式,然后以码表的形式高效地传输子块内部的深度边缘形状信息,大大提高了边缘的预测精度。重建的边缘区域可以联合已编码的相邻块一起预测剩余的平坦区域,提高了帧内编码的整体效率。   2.将基于边缘自适应的帧内编码算法扩展到HEVC框架下,并结合HEVC的特点进行适当改进。新算法首先沿着深度边缘从64×64至8×8的编码块中提取一系列子块,再对这些子块内部的边缘形状进行建模。子块的尺寸是可变的,能对深度边缘形状形成不同精度的描述,从而更好地适应不同码率的要求。   实验表明,本文所提算法在H.264/AVC和HEVC框架下均显著地提高了深度图像的帧内编码性能,不仅提高了深度数据本身的压缩效率,而且改善了合成视角的主客观质量,尤其在边缘噪声少、边缘分布广、边缘不规则的深度图像编码中发挥的优势更为明显。
其他文献
自适应调制技术表示根据无线信道的条件来选择应用的调制方案。在现代,由于带宽有限,自适应调制方案在无线通信系统中得到了广泛的使用。自适应调制方案有效地利用了可用带宽
数字水印技术作为信息隐藏的一个重要分支,在数字多媒体产品的版权保护、完整性验证、来源追踪等信息安全领域有着极其重要的作用。文本作为互联网上使用最为频繁的信息载体,由
输电线路是电力行业的重要组成部分,其安全和一贯的运营直接增加了经济的稳定和增长。由于电力线走廊的维护和检查不常规,不正确,电源走廊可能会因植被引起事故而因电力中断而受
随着Internet网和移动通信技术的不断发展,移动Ad Hoc网络也得到了极大的关注。Ad Hoc网络的分级结构因其网络的可扩充性好、网络的规模不受限制、路由控制开销较少、易实现
森林是人类生产和生活不可或缺的重要资源,随着工业的高速发展和人们生活水平的逐步提高,人类对森林资源的需求也随之升高。而森林资源也不断遭到各种各样的破坏,火灾便是其摧毁
在我国铁路建设快速发展过程中,安全一直以来处于核心地位。然而传统人工巡检方法,受线路距离及现场检测条件制约,无法保证及时将现场评估结果传送至终端技术人员,造成信息反馈滞
在各个智能手机操作系统中,Android系统凭借Google公司的技术支持和其开源特性而得到了各个公司的支持。然而,Android作为一个比较新的智能操作系统,其多媒体功能还不能满足各种
正交频分复用(OFDM)不仅具有很好的抗频率选择性衰落能力,而且能够实现语音、数据、视频等多媒体业务传输,是未来移动通信实现高质量、高速率、高频谱利用效率、高宽带的关键技术
随着数字化设备和图像处理软件日渐普及,人们可以轻易地对数字图像进行修改和编辑。若不法分子将篡改或伪造后的数字图像用于新闻报道、科学研究、保险和法庭证物等,将会对新闻
随着通信技术的快速发展,智能终端不再仅仅是移动网络的终端,而是向着家庭网络扩展,使所有终端和互联网都能进行无缝链接,从而带来更广阔的发展空间。Android是Google推出的基于L