基于CUDA的H.264视频解码

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:misscxj890417L
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
H.264,是由ITU—T视频编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视频组(Joint Video Team, JVT)提出的高度压缩数字视频编解码器标准,同时也是MPEG—4第十部分,H.264最大的自身优势就是具有非常高的数据压缩比率,在与MPEG-2和MPEG-4标准同等图像质量的条件下,H.264的压缩比是前者的2倍以上,是后者的1.5-2倍,经过H-264压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。但是由于H.264解码算法的复杂性,它要求高的计算能力来解码H.264格式的高清晰度视频编码。解码过程中需要高度并行的计算能力。然而现在的主流处理器在并行计算方面很薄弱。即使是四核心处理器带有超执行绪功能也只能提供8个并发线程的并行计算能力。通用处理器根本无法应付运算粗放经营,就越来越复杂的媒体编码/解码算法可看出。因此,CPU不能进行实时播放,导致帧频慢(fps)。在现代的计算机中,图形的处理变得越来越重要,也就更需要一个用于专门的图形的处理器,从而也就产生了图形处理器(Graphic Processing Unit, GPU)。显卡的发展令GPU的计算机能力越来越强大,GPU最初设计是为3D图形进行渲染,其所具备强大的浮点计算能力和并行特征为显示图像做了优化。基于让显卡可以用于图像计算以外的目的,显卡厂家NVIDIA推出了CUDA (Compute Unified Device Architecture)。CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。在GPU的通用计算成为目前一大研究热点背景下,CUDA得以适用的范围也愈来愈大,其技术也愈发趋向成熟,逐渐受到人们的热捧。本文充分利用CUDA可以进行大规模并行计算和处理密集型数据的特点,重点研究占整个解码时间35%以上的两个模块:反离散余弦变换(IDCT)和运动补偿(MC),提出基于CUDA的H.264视频并行解码框架,并将其实现。从实验结果可知基于CUDA的H.264架构对视频解码速度有很大的提高空间,对各种视频序列具有较好的解码性能。通过本文的研究表明,在PC机硬件配置不升级的条件下,利用CUDA体系结构强大的大规模并行计算的固有特点,在保持与传统解码相当性能的同时,能够进一步提高解码的速度,使之具备良好的适用性和实用性。
其他文献
人类社会从工业经济时代进入知识经济时代之后,知识在人们的生活中扮演着越来越重要的角色。知识管理与知识管理系统的重要性越来越被业界所认识,然而目前的知识管理系统只是
自动指纹识别系统(AFIS)通过特殊的转换设备和图像处理技术,对指纹进行采集、分析和比对,可以迅速、准确地鉴别出个人身份。通常AFIS包含三个处理阶段:指纹采集、指纹预处理以
随着互联网的发展,它已经逐步地深刻改变了我们的生活,渗透到了人类社会的各个角落,尤其移动互联网时代使互联网又经历了一次飞跃性的发展。互联网不仅与个人生活相关,更是成
仿人机器人的研究代表了机器人学的尖端水平,是一门发展迅速的综合性的前沿学科,涉及数学、计算机、机械制造、运动学等学科,是人类的最高科技梦想之一。仿人机器人具有人类外形
专利文献是具有经济价值、技术价值的战略性信息。据世界知识产权组织统计,全世界90%以上的发明创造信息都是首先通过专利文献反映出来的,90%~95%的研发成果包含在专利文献中。专利
矩阵奇异值分解作为数值计算中一个组成部分,在气象学、量子力学、生物学、医学等领域具有广泛的应用背景。其中,计算速度与计算精度是矩阵奇异值分解的两个基本问题。为了在
随着Web信息技术的日趋发展,Web信息系统已经成为人们处理工作和日常生活的一个重要平台。如何构建一个业务功能符合用户需求,系统性能稳定,用户体验友好,系统总体框架和结构
P2P(Peer-to-Peer)网络已经成为Internet上最流行的应用,但是P2P网络开放、匿名、自主等特性,使得节点可以恣意散布不可靠的资源和服务,滥用网络资源,导致节点之间缺乏信任,
在工程实践中,嵌入式系统中的系统绝大多数都需要很高的实时性,如果这样的话对于嵌入式操作系统提出了更高的实时性要求。要想使用实时操作系统内核开发嵌入式多任务操作系统,应
目前,传感器网络种类繁多,但是传感器网络之间缺乏互操作性和互通性,特定的传感器网络只能被特定的应用程序访问,造成了资源的严重浪费。由于传感器网络的异构性、信息交换方