论文部分内容阅读
图像是人们获取信息最直观、最重要的来源。随着工业控制、航天等领域对图像质量要求的逐步提升以及图像传感器技术和处理器的发展,高帧频、高分辨率成像技术有了快速的发展,且应用也越来越广泛。高帧频、高分辨率成像技术会产生大量的图像数据,为了在有限的带宽内实时获取图像信息,需对图像实时压缩,因此图像的实时压缩成为研究的重点。对于这个问题,本文通过对H.264图像编码标准和多核DSP的研究,以x264开源代码为基础,在TMS320C6678上展开H.264并行编码以及相应优化技术的研究。首先,论文阐述了图像压缩标准和图像压缩实现技术现状,从多种压缩标准和实现技术中选取x264开源代码加多核DSP模式实现H.264标准的图像压缩。其次,介绍了TMS320C6678的硬件结构、软件编程结构、核间通信模型、并行调度方案以及多核加载模式,为后面x264代码的并行与优化以及压缩平台上电自起奠定了基础。然后,对H.264图像压缩标准以及并行算法相关知识展开说明。从图片组、帧、片以及宏块四个层次对H.264的并行压缩编码技术进行了分析,通过对比选取Slice级为并行编码模型。最后结合x264开源代码特点在TMS320C6678平台上实现了H.264标准的图像编码,主要做的工作包括:编写上位机软件,用于向压缩平台发送图像数据与接收压缩数据;修改x264源码使其符合CCS编译规则,调整内存布局,在DSP上初步实现H.264图像压缩编码;采用动态Slice划分和静态Slice划分算法将一帧图像划分为若干片,利用OpenMP并行调度方案,将划分后的Slice分配到C6678的core0-core6实现编码器的Slice级并行;采用项目级优化、内联函数嵌入、软件流水等方式对编码器进行优化,提高编码速率。通过对编码器并行化与优化处理前后编码速率的比较,基于TMS320C6678平台的编码速率由3.30帧/秒提升到159.98帧/秒。由此可以看出对编码器的片级并行处理与后续优化有效的提升了编码速率。