面向媒体解码的可重构计算关键技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:wohaishixinyonghu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可重构计算兼具通用计算高灵活性和专用计算高性能的特点,近年来已逐渐在媒体解码等计算密集型应用中占据一席之地。可重构系统在处理媒体解码时面临大量的片上和片外数据访问需求,需要灵活高效的数据访存通路,以保障可重构阵列的流水效率;可重构系统实现媒体解码不同核心子算法所需的任务调度机制,则对硬件资源利用率乃至系统性能产生显著影响。面向媒体解码的可重构数据访存通路和任务调度机制中存在以下问题:核心子算法中间结果数据输出存储方式与数据输入使用方式不一致,造成可重构阵列计算过程的流水气泡;媒体算法中以参考帧为主的大量片外二维数据的访存需求,导致DDR外存中换行次数多,访问延迟大;核心子算法间和媒体码流宏块间的计算复杂度差异大,导致可重构处理单元负载失衡,从而影响可重构系统的硬件利用率提升。  本文对媒体解码算法按数据密集型和控制密集型进行子算法划分,分析并提炼不同核心子算法的数据流及任务计算负载差异的主要特征,设计面向媒体解码的可重构基本架构,研究并优化可重构系统中的数据访存通路和任务调度机制,最终将优化方案应用于可重构架构中并进行芯片和整机验证。本文主要工作与创新点如下:  1)提出了基于数据块拆分拼接的传输控制结构,能够进行单/多块数据按行交织拆分拼接和单块数据转置拼接,从而在中间结果数据传输过程中实现了数据规整,解决了数据输出和输入间组织形式不一致的问题,提高了可重构阵列运算的流水效率。实验结果表明,和已有片上数据传输结构相比,本文数据传输控制结构将媒体算法核心子算法性能提升了20.9%~77.3%,而由此引发的额外硬件开销仅占可重构系统的10.7%。  2)改进了多分量双向预测的二维数据缓存结构,对不同分量不同预测方向的参考帧数据独立分配缓存空间,并探索最优缓存尺寸,优化了基于块划分尺寸的缓存数据更新策略,在数据不命中情况下以部分命中阈值、连续不命中次数等参数作为缓存更新的判定数据,从而减少了外存DDR的换行次数,降低了访问延迟,最终提升了访存性能。实验结果表明,本文二维访存方案使得可重构系统外存访问性能提升了42.58%~45.35%。与已有的二维访存方案相比,本文缓存开销为其87%,性能收益达到其1.18倍;与已有的三维访存方案相比,本文性能达到77%,但存储开销只有其7%。  3)改进了基于混合划分的任务调度机制,在片级采用线程级流水方式,在宏块和子块级采用线程级并行方式,包括不同核心子算法在宏块级的线程并行调度以及同一核心子算法在子块级的线程并行调度,大幅缓解了可重构系统中的不同运算单元间任务负载失衡问题,提高了可重构系统的硬件资源利用率。实验结果表明,相比已有方案运算单元间11%和25%的负载差异,本文改进的任务调度机制使得运算单元间负载差异降至5%,硬件平均有效利用率由52%提升至85%。  本文研究成果应用于面向媒体解码的可重构处理架构,面向高清媒体处理的高性能需求和移动终端应用的低功耗需求,采用TSMC65nm LP工艺分别实现了两款SoC芯片和整机应用。第三方测试结果表明,面向高清媒体处理的可重构SoC芯片可工作在200MHz主频,实现H.264/MPEG2/AVS等媒体标准的1080p(1920×1080)分辨率30fps实时解码,其能效是可重构处理器XPP-Ⅲ的16.7倍;面向移动终端应用的可重构SoC芯片工作在166MHz主频,实现H.264/AVS等媒体标准的D1(720×480)分辨率30fps实时解码,其能效是ADRES可重构处理器的1.23倍。
其他文献
低温、干旱和高盐等非生物逆境严重地制约了植物的生长发育,影响了作物的产量,在全球自然环境日益恶化的情况下,干旱和盐碱化已经成为许多地区农业生产发展的瓶颈,因而耐逆作物品
传统的自动指纹识别系统在工作时一般采用逐一对比的指纹识别模式,在面对大容量的指纹数据库时,系统的处理时间可能需要几个小时甚至更长,对于实时性要求较高的一些场合而言,这显
射频识别(RFID)技术是利用射频进行通信,无须物理接触而能识别并交换数据,比传统的IC卡、磁卡实用且使用方便,因此获得了广泛的应用。本文在现有的RFID系统阅读器的射频通道技术
时间是物质运动和存在的基本属性之一,精密的时间作为科学研究、科学实验和工程技术诸方面的基本物理参量,为一切动力学系统和时序过程的测量和定量研究提供了必不可少的时基
本课题来源于河南省科技攻关计划项目“分形图像压缩编码的算法研究及DSP实现”。本项目的工作包括以下四个方面: 一、图像的自相似性研究; 二、提出一种快速分形图像
本文主要是介绍直流平面磁控溅射法制备二氧化钒相变膜工艺的研究。围绕二氧化钒相变膜制备技术,介绍了磁控溅射法制备工艺、退火工艺、表面成分分析及光学实验在内的整个制
大气氮沉降的增加,改变了土壤理化性质,间接影响生态系统碳循环,进而影响全球气候变化。土壤氮和水分有效性是干旱半干旱区生态系统的重要限制因子。2007年IPCC第4次评估报告指
近年来,随着科学技术的发展,特别是人工智能的发展已影响着各行各业。专家系统在人工智能的重要分支,它的发展是本世纪科技发展的重点之一。本文从专家系统的发展谈起,分析了
为了适应当代32 位奔腾PC 原理和接口技术教学实验的要求,需要建立一个灵活性高、内容比较丰富、适合当前微机技术发展的现代化开发平台。通过开发平台不仅能够培养学生的实
学位