基于NEON引擎的JM解码器并行优化实现

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:pjzh210427
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ARM公司在其最新的基于ARMv7架构的Cortex-A系列处理器上,首次集成了"NEON媒体处理引擎”。NEON引擎提供了ARM平台先进的基于SIMD的指令集,能够实现一条指令同时对多个数据进行处理,实现数据级别的并行处理。NEON引擎能有效加速音视频编解码及图像处理等应用。当前,对于低端ARM平台来说,由于其硬件成本及功耗限制,音视频应用、2D/3D游戏等多媒体应用,通常使用常规ARM指令集实现。然而,如果采用集成NEON引擎的ARM处理器,就可能使用NEON指令集对此类应用中计算复杂度高,且符合SIMD优化特点的部分进行优化,将对数据的串行运算转化为并行运算,进而加速应用处理速度。这对于硬件成本及功耗苛求的ARM处理平台来说,具有重要的应用价值。当前对NEON的应用研究仍较少,尤其在NEON技术特性、指令功能、应用方法及实际应用效果等方面,而且基于NEON指令集实现的可用功能函数库较少。因此,本文基于ARM Cortex-A9处理器内置的NEON引擎,深入研究了NEON技术,主要包括其技术特性、指令集功能、应用方法等,并利用JM解码器(H.264官方实现)这个软件平台进行具体的NEON优化,主要包括帧间运动补偿、去方块效应滤波、逆变换和帧内预测这四个模块,最后完成优化前后的效果测试,为打算利用NEON技术进行优化的研究人员和应用开发者提供技术参考和借鉴。测试软硬件平台采用PandaBoard开发板和基于Linux3.4.0的Ubuntu系统,对不同分辨率的多个测试序列进行了解码测试。测试结果表明,在各模块优化效果方面,逆变换部分的优化效果最好。在JM解码器整体效果方面,优化后的解码速率提高了接近1倍,而且提高分辨率并不影响优化效果。这说明了ARM平台上NEON技术对于多媒体应用的加速效果是有效且明显的。
其他文献
随着大数据时代的来临,传统的关系型数据库已经不能满足人们的需求。图数据库具有处理大量复杂、互连接、低结构化的数据的优点。因此如何把数据从关系型数据库迁移到图数据
以市场化下的社会变迁作为背景框架来对既有的青年农民工婚姻研究的相关文献进行梳理,特别是对青年农民工婚姻研究中的性问题、婚姻状态与婚姻行为、"闪婚"现象等相关主题进
本文在对行业收入差距形成机理进行理论诠释的基础上,应用计量经济学中的Panel Data方法,以浙江省为例,对行业收入差距的形成机理进行了实证检验。模型结果显示,从对行业收入
永磁同步电机(Permanent Magnet Synchronous Motor, PMSM)驱动系统凭借控制简单、功率密度高和控制精度高等优点在密集型工业加工中得到广泛应用。目前,基于PID的位置-速度-
氢作为化工原料和新能源,正受到广泛关注,以煤炭为原料规模化制取氢源,是一条具有中国特色的解决氢源问题的制氢路线。介绍了煤炭制氢技术现状,论述了神华煤作为制氢原料的特
目的探讨半清醒慢诱导法处理极度困难气管插管的方法及效果。方法采用回顾性分析法对1例极度困难气管插管患者的临床资料进行分析,总结对其采用的半清醒慢诱导法,评价效果。
关怀“他者”是人类学主要的学科传统。当代人类学通过参与发展的理论与实践 ,更是把对“他者”的关怀落到了实处。本文通过作者近年来所从事的一些国内社区发展项目的社会评
目的观察健康宣教对心脏瓣膜置换术后患者抗凝治疗依从性的影响。方法将88例心脏瓣膜置换术患者作为研究对象,随机分为观察组和对照组,各44例,对照组采取常规出院指导,观察组在对
未来我国将建成以特高压网架为骨干的大型互联电网,交流电网的复杂程度不断增加,潮流控制问题变得更加复杂。移相器是一种控制输电潮流的有效装置,目前机械式移相器已在国外
传染病一旦爆发会给人类带来巨大的损失,是人类面临的一项重大挑战和威胁,对传染病爆发的趋势进行预测,可以提早的做好预警工作,减少损失,具有重大的意义。随着机器学习研究