论文部分内容阅读
进入21世纪以来,人们加快了高科技发展的步伐,人们生活中,视频聊天、视频会议、网络电视、高清电视等已经非常普遍,这些应用导致了巨大的视频数据,对存储以及网络传输构成了极大的挑战。视频编码或视频压缩就是解决这一挑战的一个极其重要的技术。视频编码的主要目标就是减少描述视频所需的数据量,同时保持视频的视觉质量。历经半世纪的研究发展,视频编码技术已经形成了以预测编码、变换量化编码、熵编码为核心的混合编码框架。作为视频编码一大核心技术,预测编码对视频编码的性能有很大的贡献,其基本思想是利用相关性通过已编码重构信号对待编码信号进行预测,然后对残差信号编码。目前视频编码的预测编码技术有基于空间相关性的帧内预测和基于时间相关性的帧间预测,二者都是基于单一相关性的预测。本文对基于时空相关性的帧间帧内混合预测编码进行深入研究。距离越近空间相关性越强,平滑区域的相邻区域也很可能是平滑的,基于上述两大思想本文提出新颖的混合预测策略。如果当前块的最佳预测模式是帧间预测模式,则启动时空混合预测模式,将当前块划分为帧内预测区域和帧间预测区域,其中帧内预测区域靠近参考块。论文通过模拟证实帧间帧内混合预测编码能获得更佳的编码性能,其关键问题是额外模式信息比特的消除以及帧间帧内权值的确定。虽然视频编码能够极大减少视频信号所需的比特数,但由于视频压缩中基于块的量化,视频帧会遭受一些退化,比较主要有块效应以及边缘震荡效应。块效应对于人眼来说比较敏感,因此,一个高效的去块效应算法非常有必要。经过多年的研究,目前有很多高效的压缩视频去块效应算法,例如视频编码标准中非常成熟的环路滤波。K奇异值分解(K-Singular Value Decomposition, K-SVD)图像去块效应算法是基于自适应过完备字典的信号稀疏表示来去块效应,而且其性能优于其他图形去块效应算法。本文结合K-SVD算法和视频压缩的信息提出了基于自适应过完备字典稀疏表示的压缩视频去块效应算法。K-SVD算法是个迭代过程,每个过程分为两个阶段:基于当前已知字典对信号进行稀疏表示,然后更新字典同时更新稀疏表示的系数。论文通过实验证明该算法在主客观评价标准都得到了很大的提升,对于I帧PSNR提高0.4dB左右。