基于嵌入式移动GPU的图像编解码并行优化

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:fanlinliuliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ARM Cortex-A15系列处理器是当前最新的嵌入式ARM SoC,该系列处理器首次集成了Mali-T600系列的移动GPU,该系列GPU率先支持OpenCL计算框架,可以利用GPGPU (General-Purpose computation on GPU)技术有效加速通用计算,其特殊的异构多核结构为多媒体处理,尤其是图像编解码和数字图像处理等应用提供了并行加速的旷阔空间。近年来,随着移动互联网的快速发展以及智能移动终端的快速普及,以视频编解码技术为核心的移动视频类应用得到广泛应用,传统的嵌入式平台上依赖于CPU的串行计算的方案已经难以处理这类大数据量的计算密集型问题,GPGPU并行加速技术在硬件成本和功耗严格限制的ARM嵌入式平台上具有重要的应用价值。当前国内外对于移动GPU的GPGPU技术的应用研究较少,尤其是缺乏实际的应用实例和方法总结,因此本文基于Mali-T604嵌入式移动GPU深入研究了GPGPU技术在ARM嵌入式平台的应用方法,主要包括移动GPU的硬件结构,并行计算模型、编程方法等,并针对LibJpeg (Jpeg Codec官方实现)以及Xvid(公认的Mepg4 Codec优秀实现)两个开源项目对Jpeg静态图像解码算法和Mpeg4动态图像编码算法基于Mali-T604 GPU的GPGPU技术和ARM Neon多媒体指令集进行并行优化,主要包含离散余弦变换、像素内插、运动估计、运动补偿、色彩空间转换等计算密集型功能模块的并行化,最后完成了优化效果的实际测试,并对优化结果进行了分析和总结。本文采用的硬件测试平台是Arndale Board开发板,该平台以三星的Exynos5250处理器为核心,搭载了Mali-T604移动GPU,软件平台采用Linaro机构为Arndale Board定制的基于Ubuntu的嵌入式Linux操作系统,其内核版本为3.10.37。对不同分辨率和不同内容的视频序列的测试结果表明,不论是针对静态图像还是动态图像,Mali GPU的并行加速能力均能提供可观的加速比,尤其是针对高分辨率的图像编解码,加速比达到4倍左右,证明嵌入式GPU的GPGPU技术对于多媒体应用的加速有效而显著。
其他文献
学位
基于内容的图像检索(CBIR)是多媒体信息检索领域的一项新兴技术。与传统利用文本标注的检索方式相比,它具有对图像内容描述充分、客观性强、自动高效等优点,有着极为广阔的应用
随着SOA架构的不断发展和成熟,整个IT业在向其转变。企业通过整合由其他企业提供的服务资源形成新的服务来满足用户不断变化的需求,从而增强市场竞争力。然而,各企业对外提供
判别分析(DiscriminantAnalysis)是模式识别领域的重要研究内容之一。过去几十年来,判别分析在理论和应用上均取得了很大进展。然而,在一些实际应用中,当没有足够多的有标注
基于多视角的唇动的身份识别技术,是多视角人脸识别和正面唇动身份识别的生物特征识别技术的延伸和组合。说话时的唇动信息,既体现了说话人嘴唇的固有生理特点,也反映了运动
水面倒影图像是非常常见的一种自然景观图像。目前对水面倒影图像的研究多集中在如何拍摄、制作虚拟现实的实现上,而基于视觉的对水面倒影图像理解和检测方面国内外都未开展
学位
随着信息化时代的到来,人类对信息的需求越来越丰富。作为诸多计算机研究中最为活跃领域之一的视频编码技术也随着应用要求的改变而不断发展。传统视频压缩编码标准,如MPEG-X系
随着信息化技术的迅猛发展和国际化市场竞争的日趋激烈,企业的全球化与信息化已成为必然趋势,各企业之间的业务协作越来越频繁,也越来越复杂。然而由于各个伙伴企业的模型在
BT是一种P2P协议,以集中式结构为基础的应用层协议。该协议及其软件自出现以来,因其强大的文件共享功能而备受欢迎。BT在带来便利的同时,也带来许多问题,如占用网络带宽、传