H.264视频编码的并行实现

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:mchz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频处理技术是伴随着视频从模拟到数字化转变的过程中得到蓬勃发展的。随着人们对视频图像的清晰度、流畅度、实时度的要求越来越苛刻,使其成为了一项炙手可热的技术。1980年以来,国际电信联盟(ITU)和国际标准化组织(ISO)先后颁发了一系列关于静止和活动图像的压缩标准,奠定了该技术的雏形。H.264被称为新一代先进视频编码标准,H.264相对以前的编码方法,在图像内容预测方面提高了编码效率,它采用帧内预测、可变块大小运动补偿、1/4采样精度运动补偿等算法改善了图像质量,增加了纠错功能和各种网络环境传输的适应性。但与此同时,计算复杂度也随之增加了。编码的计算复杂度大约相当于H.263的3倍,解码复杂度大约相当H.263的2倍,这就限制了它在实时视频编码中的应用。因此,改进H.264的相关算法,降低它的计算复杂度是非常有必要的。CUDA(Compute Unified Device Architecture)是一种由NVIDIA推出的通用并行计算架构,它包含了CUDA指令集架构(ISA)以及GPU(Graphic Processing Unit)内部的并行计算引擎。该架构是用于GPU计算的开发环境,它运用了GPU中大量闲置的流处理器的资源,进行大规模并行计算科学计算。GPU(Graphics Processor Unit)起初主要应用于3D图形渲染,受游戏市场和军事视景仿真需求的牵引,GPU性能提供速度很快。目前,越来越多的软件开发人员正在使用CUDA软件开发工具来解决各种专业以及家用应用程序中的问题。这些应用程序从视频与音频处理和物理效果模拟到石油天然气勘探、产品设计、医学成像以及科学研究,涵盖了各个领域。于是将GPU用于视频编解码已成了一大研究热点。帧内预测算法在较大程度上增加了计算复杂度。为了找到一个宏块的最佳编码模式,需要对亮度块与色度块的大量模式组合全部搜索一遍,率失真代价的计算量相当庞大,使得H.264的编码复杂度大大增加。因此本文提出了一种改进的快速帧内预测算法,并将该算法并行实现。利用GPU的强大浮点计算能力和并行特性,提出了CPU+GPU的并行编码架构,总结CUDA技术对并行效率的影响,并将SAD计算部分并行实现,更高程度上提高编码效率。
其他文献
网格技术是分布式网络技术的一个新发展,它将属于不同管理域的,异构资源灵活有效地组织起来,目的在于实现更高层次上的资源共享。即共享的资源不仅包含目前广泛使用的网页信
随着网络和通信技术的快速发展、信息资源的极大丰富,越来越多的数字图像通过网络广泛传播,极大地方便了人们的使用。然而,这种便捷也带来了许多信息安全问题,诸如数字图像内
序列密码是对称密码学的一个重要分支,被广泛应用在对安全性要求比较高的场合比如军事、通讯。与分组密码相比,序列密码具有硬件实现简单、加解密速度快以及错误传播少等优势
目标跟踪最初是为适应现代军事发展的需要而被提出的,经过众多国内外学者的研究,已经发展成为一个具有普遍实用性的领域。在空中侦察与预警、弹道导弹防御、战场监视等军事领
在各种多媒体服务和数字通信等应用领域,图像编码是至关重要的技术之一。上世纪90年代,分形图像编码作为一种全新压缩编码方法开始兴起,它的整体理论是建立在图像自相似基础
无线传感器网络(Wireless Sensor Networks,简称WSNs)是由分布在目标区域内大量传感器节点自组织形成的一类网络,广泛应用于各种特殊的监测任务。这些应用都是由传感器节点收
集群式供应链是一种新型的企业协作模式,通过企业服务间的动态匹配和组合来应对动态多变的市场需求,且不必因维持过高的产能而导致其自身的成本增加。然而,服务资源的非均等化现
远程教学是目前教学改革的重要内容,而虚拟实验室填补了远程教学中教学实践方面的空白,对提高远程教学的质量具有重要的意义。但是,当前的虚拟实验平台普遍不能支持异构资源
聚类技术作为数据挖掘领域的一个重要研究方向,可以有效地帮助人们了解数据的分布和特征,以便作进一步研究分析。虽然已有的聚类算法很多,但聚类技术依然存在很多问题和挑战
学位