论文部分内容阅读
目前最新的视频标准H.264/AVC可以支持从QCIF格式到HDTV的所有格式,这么宽阔的覆盖面使得H.264/AVC标准已经成为实现视频系统的一个很好选择。在H.264/AVC视频编码器的各个组成部分中,运动估计占据了重要的地位。几乎有89%的计算复杂度是在运动估计部分的,而其中整数点运动估计(IME)占据了52%的运算量。这也使得IME硬件结构在整个视频编码器中十分重要。本文主要基于H.264/AVC视频编码标准,提出并设计了视频编码器中IME的硬件结构。
在硬件设计时,视频编码器中每个时钟周期巨大的数据吞吐量也使得视频系统必须采用几级流水线结构。这也使得许多传统的快速算法无法高效地硬件实现。通常主要采用的硬件算法是全搜索算法。与其他算法相比较,该算法能够提供最好的图象质量,且易于硬件实现。硬件利用率,硬件开销,功耗是硬件设计的关键。本论文基于这些因素,分析了2种现存的高效IME硬件结构并提出了2中适合于不同应用的新型IME硬件结构。
在小尺寸图象视频编码器中,为了保证图象质量,所有搜索模式都是必须的。目前,与其他各种IME硬件结构相比,由台湾陈良基教授(IEEE Fellow)提出的Propagate Partial SAD(PPSAD)结构有着高效的数据通路和抗高频影响性。本文在分析PPSAD结构的基础上,提出了一种低硬件开销的SPPSAD结构。该结构和原PPSAD结构有着同样的性能,而硬件开销却比原有结构大大减少。
在大尺寸图象视频编码器中,由于吞吐量的巨增,并行性是个必须被考虑的问题。由台湾陈良基教授提SAD Tree结构有着很好的并行性和数据重用性。对于大尺寸图象,8×8以下的小搜索模式对于图象质量的贡献很微小,所以一般采用减模式的方式来牺牲微小的图象质量换取硬件开销的大大减少。本文提出了一种基于减模式方式的MRPPSAD结构。实验结果证明,该结构比传统SADT结构有着更少的硬件开销和很强的抗高频影响性。
文中所提出的硬件结构都在Window和Linux平台上通过了功能验证和时序验证。在TSMC 0.18工艺最坏情况下SPPSAD可以节省12.1%的原PPSAD结构的硬件开销,而MRPPSAD可以比SADT结构减少24%-28%硬件开销。SPPSAD的最高工作频率是227MHz,而MRPPSAD是200MHz,其均高于原PPSAD和SADTree的最高工作频率。再者,本文应用了一种内存映射算法和加法树优化方法,可以有效的提高内存IO利用率和减少综合时加法器的使用。与现有的设计相比较,本论文中所提的方法可以降低整个IME部分的功耗。