论文部分内容阅读
H.264,是由ITU—T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(Joint Video Team, JVT)提出的高度压缩数字视频编解码器标准,同时也是MPEG—4第十部分,H.264最大的自身优势就是具有非常高的数据压缩比率,在与MPEG-2和MPEG-4标准同等图像质量的条件下,H.264的压缩比是前者的2倍以上,是后者的1.5-2倍,经过H-264压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。但是由于H.264解码算法的复杂性,它要求高的计算能力来解码H.264格式的高清晰度视频编码。解码过程中需要高度并行的计算能力。然而现在的主流处理器在并行计算方面很薄弱。即使是四核心处理器带有超执行绪功能也只能提供8个并发线程的并行计算能力。通用处理器根本无法应付运算粗放经营,就越来越复杂的媒体编码/解码算法可看出。因此,CPU不能进行实时播放,导致帧频慢(fps)。在现代的计算机中,图形的处理变得越来越重要,也就更需要一个用于专门的图形的处理器,从而也就产生了图形处理器(Graphic Processing Unit, GPU)。显卡的发展令GPU的计算机能力越来越强大,GPU最初设计是为3D图形进行渲染,其所具备强大的浮点计算能力和并行特征为显示图像做了优化。基于让显卡可以用于图像计算以外的目的,显卡厂家NVIDIA推出了CUDA (Compute Unified Device Architecture)。CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。在GPU的通用计算成为目前一大研究热点背景下,CUDA得以适用的范围也愈来愈大,其技术也愈发趋向成熟,逐渐受到人们的热捧。本文充分利用CUDA可以进行大规模并行计算和处理密集型数据的特点,重点研究占整个解码时间35%以上的两个模块:反离散余弦变换(IDCT)和运动补偿(MC),提出基于CUDA的H.264视频并行解码框架,并将其实现。从实验结果可知基于CUDA的H.264架构对视频解码速度有很大的提高空间,对各种视频序列具有较好的解码性能。通过本文的研究表明,在PC机硬件配置不升级的条件下,利用CUDA体系结构强大的大规模并行计算的固有特点,在保持与传统解码相当性能的同时,能够进一步提高解码的速度,使之具备良好的适用性和实用性。