论文部分内容阅读
立体图像和视频编码是视频信号处理领域一个较新的研究方向,其基本研究目的是利用立体图像和视频的一些特征有效地减少数据量,使得对它的存储和传输更加容易。核心技术有视差估计、遮挡检测、立体残差图像编码、运动和视差的联合估计等。本论文对该领域中若干核心技术进行了研究,提出了一系列的功能算法,并且为该领域未来的发展提出了一些建议。 论文研究了传统的基于块匹配的立体图像编码方法,在此基础上,提出了一种新的利用亮度变化信息的自适应块匹配立体图像编码算法。它可以根据图像内容自适应地选择合适的匹配窗口进行视差估计,在一定程度上提高了估计的准确性和编码的效率。论文利用DT(Delaunay Triangular)网格模型把基于特征点的视差估计算法引入立体图像编码方案中,这种方法在提高视差估计准确性的同时还充分地利用了三角形网格模型在图像编码方面的优越性。为了进一步提高编码效率,论文还针对三角形模型设计了视差矢量优化算法、遮挡区域检测算法和有益于提高解码速度的三角形节点的传输顺序,整个算法从主、客观角度均优于传统算法。论文结合文献从数学分析和数据统计两个方面研究了立体残差图像的特征,认为DCT比小波变换更适合进行残差图像编码。在此基础上,使用改进的比特平面编码技术编码立体残差图像,在提高编码效率的同时还可以产生嵌入式码流,满足网络传输的要求。 论文系统地介绍了成熟的立体视频编码算法,并按照预测方式的不同把这些算法分为三类。论文根据立体视频的特征提出了多模式预测的编码方法,该方法以宏块为单位,在单独使用视差估计、单独使用运动估计、联合视差和运动估计三个模式中利用R-D代价函数自适应地选择最优的一种,较大地提高了编码效率。论文在讨论了针对网络环境使用的可伸缩性视频编码方法之后,战略性地指出立体视频的可伸缩性编码必然是今后研究的一个重点。并在普通视频可伸缩性编码已有成果的基础上提出了两个设计方案和相应的码流分配策略,为立体视频可伸缩性编码领域的进一步发展提供了参考。