论文部分内容阅读
随着多媒体技术的发展,大规模视频数据的处理和传输已成为当前的迫切需求。H.264视频编解码标准具有高效的视频压缩性能,广泛的应用于视频传输等应用领域。但是,单核环境下的串行H.264编解码已经不能满足实时处理高质量视频数据的要求。多核技术的发展突破了单核计算的瓶颈限制,特别是多核技术开始从同构多核处理器向异构多核处理器的架构发展,这为包括多媒体处理在内的高性能计算提供了优异的计算平台。
本文在以往研究工作的基础上,分别在同构多核环境和异构多核环境下设计和优化H.264并行编解码算法。在同构多核环境下,分析比较不同层次下并行编解码的特点,设计基于多线程的片(Slice)级并行编解码算法,根据测试结果研究线程数、并行加速比和图像质量之间的关系;在异构多核环境下,研究SAD值计算、去方块滤波和DCT变换的GPU并行加速算法,设计基于CUDA并行加速的H.264编解码器,总结归纳在异构多核环境下进行并行计算的方法和注意点。
本文的研究结果表明:同构多核环境下的多线程并行编码的确加快了整个编解码的效率,但线程数量的增多并不会带来编解码器性能更大程度上的提升,反而会带来图像质量的下降。异构多核环境下的基于CUDA的并行计算在性能上有了极大的提升,同时也降低了CPU的资源负载,依靠GPU强大的数据处理能力,有利于对大规模视频数据进行并行编解码。由于不同的编程模式使得目前的研究只能针对几个核心功能模块的改进,将H.264整体流程纳入到CUDA的架构上是今后研究的方向和重点。
本文对于多核环境下的多媒体处理等相关领域的研究具有一定的借鉴意义。