论文部分内容阅读
二十世纪九十年代以来,数字视频压缩技术被广泛应用于通信、个人计算机、广播电视、消费电子等领域,堪称数字媒体产业的最核心技术之一。以MPEG-2为代表的信源编码标准获得了巨大的成功。进入新世纪以来,以H.264/AVC和AVS为代表的新一代信源编码标准出现了。AVS标准是我国具有自主知识产权的信源编码标准。2006年2月,AVS视频标准已经正式被批准为国家标准,进入了产业化推广的阶段。由于AVS视频标准的主要应用对象是标准清晰度/高清晰度电视,编码过程的计算复杂度较大,对编码器的优化设计提出了挑战。
编码器优化中最为重要的一个问题就是帧间预测,帧问预测的主要目的是去除视频序列中的时域冗余,它是混合视频编码框架中对性能影响最为重要的一个环节,也是复杂度最高,耗费芯片面积和功耗最大的环节。特别是H.264和AVS标准中为了提高编码效率,引入了一系列的新技术:如1/4像素精度的运动估计,多模式预测,多帧参考和基于率失真优化的预测模式决策等等。这些都大大地提高了复杂度。
本论文以帧间预测技术为研究对象,包括运动估计和预测模式决策两个方面,寻求编码效率,编码速度,硬件耗费三者之间的最优折衷点。本论文的工作包括算法优化和芯片结构设计两个方面。在具体标准的应用方面,着重于AVS编码器的优化设计。
本文的主要内容包括以下五点:
1)基于计算量分配的复杂度可伸缩的运动估计算法:该方法利用以前的运动信息,先合理地分配计算资源给不同的宏块,然后每个宏块用复杂度渐进的方式使用所分得的计算量。这样运动估计过程能够与编码器的计算能力相匹配,在不超过编码器计算复杂度预算的条件下可以获得尽量好的编码性能。
2)针对AVS全搜索运动估计的算法与芯片结构联合设计:对运动矢量预测残差的概率分布进行数学建模,利用拉普拉斯分布的数学特性推导出全搜索窗口大小的上限,降低了复杂度并保持搜索精度。然后用阵列结构实现了全搜索方法,达成了高并行和全流水。
3)针对AVS整数/分数运动估计的可重用芯片结构:设计了一个可重用的芯片结构,该结构利用可配置的阵列来生成不同ME模式所需的参考像素,可以被整数/分数运动估计所复用,降低了芯片面积。该结构可以支持多种快速搜索模式和块类型,从而为实现复杂度可控的编码器提供了条件。计算资源的分配使得最重要的搜索模式和块类型得到最多的计算量,从而在实时约束下达到编码效率最高。
4)针对AVS率失真优化模式决策的芯片结构:率失真优化的模式决策对于编码器的性能影响较大且复杂度高,因此有用芯片实现的必要。本文针对AVS率失真优化的预测模式决策,设计了一个计算引擎,该结构进行像素级流水,可以完整的计算出各个预测模式所需的比特数和失真度。从而为模式决策提供信息。
5)针对AVS帧间预测的整体芯片结构:基于3)和4)的工作,设计了一个整体芯片结构。该结构由三级流水组成。该结构中使用了第3)点中所提出的可重用结构来完成ME。MD阶段则使用了两个第4)点中所提出的计算引擎,并合理地分配任务以满足实时性。由于使用了数据复用,使得访存带宽大大降低。片上缓冲区的合理组织可以实现各阶段的并行流水操作。该结构可以支持720P(1280×720)序列30帧每秒的帧间预测,并保持编码性能。
总之,本论文研究了帧间预测的各个部分,最终设计出了一个优化的整体芯片结构来完成AVS的帧间预测,设计的主要思路是寻求编码耗费与编码性能之间的最优折衷点。