论文部分内容阅读
网络、3G技术的发展促进了视频通信领域中具有较高压缩效率、更好的网络健壮性的视频压缩标准的应用和研究。但视频压缩编码的计算密集性和数据密集性依然是H.264/AVC等标准在应用中的制约因素。NVIDIA推出的CUDA架构,将GPU所具有的高性能计算能力进一步的挖掘出来,能够将GPU高性能计算应用到科学计算、图形图像处理等对数据计算需求特别高的领域。基于CPU与GPU的异构并行体系,将其应用于视频编码技术,并针对视频压缩编码中关键技术的研究,对提高多媒体应用技术、高性能计算技术有着巨大的推动作用。本文以CUDA架构的并行计算和运动估计算法为主要研究对象,提出了运动估计估算法基于CUDA的并行计算模型以及最优化模型。本文的研究成果主要包括:第一,分析研究了基于CPU/GPU异构体系的并行计算模型,提出适于全局运动估计的并行计算模型。首先分析了全局运动估计算法的特点,采用CUDA架构上多线程矩阵迭代完成运动估计匹配;然后根据CUDA架构的异步机制,隐藏了kernel函数执行带来的部分时延。该模型在运动估计算法上取得了明显的加速效果。第二,提出了适于快速搜索运动估计算法的并行计算模型。该模型在block内以预测块为最小并行单元,基于warp均衡计算量;每个warp处理一个或多个预测块与当前块的匹配。该模型基于warp划分并行计算任务,可以适用于多种快速搜索模型;实现了在CUDA架构上的数据分治模型。第三,提出了一个基于CUDA的最优化模型。该模型分析了GPU中各种硬件资源对并行程序性能的影响,并采用CUDA profiler对并行程序进行了测试:对比分析了不同warp数量、GPU资源占用情况、并行程序性能的关系。