可重构媒体处理器及可重构编解码处理器的研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:sunku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着游戏、高清影像播放的迅速发展,媒体处理应用日趋广泛。其应用系统的整体性能对处理能力的需求不断提升,同时要求兼容当前媒体处理的多格式和多标准。   另一方面,随着集成电路制造工艺的演进,尤其是进入90nm-65nm工艺节点后,集成电路产品的研发费用(NonRecurring Engineering,NRE)越来越高,设计的重用性和设计的快速性成为设计人员的关心重点,要求一次设计能够满足多种产品需求,分摊研发成本。   因此,设计满足当前和未来媒体处理的应用需求,具有提升计算性能的可扩展性和高度灵活性,并满足媒体处理应用对多格式、多标准的兼容需求的可重构处理器成为当前的研究热点。   本文基于媒体处理应用特点提出并设计完成了一种可重构处理器结构ReMAP,经过仿真和流片验证,表明能够满足媒体处理的性能要求,并具有较高的灵活性和扩展性。建立了ReMAP的精确到时钟级的性能仿真平台ReSim,面向视频编解码算法应用对可重构处理器的互连结构、计算单元、计算模型和数据接口进行了深入研究和仿真,设计了一款可重构编解码处理器ReCAP。论文的主要工作和创新点如下:   1)提出了一种基于运算并行的粗粒度可重构处理器结构ReMAP和指令系统,适合于媒体处理应用。该结构由多个计算核心reDSP级联组成。每个计算核心reDSP包含一个ALU单元簇和一个控制单元,通过互连单元组成的通信网络完成数据交换,具有良好的扩展性和运算处理能力。reDSP中ALU簇可通过指令中的配置信息实时改变运算单元的计算功能和连接方式,具有较高的灵活性。   2)ReMAP中reDSP的指令系统基于配置信息流设计,具有简化可重构处理器的控制逻辑的优点,增强了可重构处理器的扩展性,并具有良好的算法保密性,可满足应用人员对核心算法的保护需求。基于ReMAP处理器硬件结构和指令集设计目前已获得国家专利授权。   3)为精确评估可重构处理器设计的功能和性能,设计了一个基于三级软件框架层次、模块化设计、时钟周期精确的可重构处理器仿真平台ReSim,可快速搭建可重构处理器的目标仿真模型,验证其正确性和有效性,精确评估计算性能,具有可视化、易于调试的特点。   4)基于SMIC0.18um logic6层金属工艺进行了ReMAP的原型验证流片,该芯片包含16个ALU单元,工作主频可达150MHz,面积为4.2mm*1.3mm,1.62V工作电压下最高性能可达2.4GOPS,面向媒体处理算法具有较高的性能加速,8*8 DCT算法的实现性能相比通用DSP及媒体处理器提升了1.4~6.2倍。   5)设计了一款针对高清视频编解码应用的可重构处理器ReCAP。通过优化可重构处理器的互连结构、处理单元结构、计算模型、数据传输接口,提升了可重构处理器面向视频编解码应用的处理性能。通过在仿真平台ReSim中搭建的ReCAP结构模型,对多个H.264编解码的子算法进行了映射,如整数搜索、1/2插值、1/4插值、1/8插值、DCT、残差、帧内预测、量化等。映射结果显示,面向视频编解码算法实现,ReCAP与Morphosys等同类型可重构处理器相比执行性能有1.16~2.85倍的提升,较常用的媒体处理器有较大幅度的性能加速,可达到或接近ASIC的处理性能,适合于高性能/实时视频编解码应用。
其他文献
集成电路制造工艺的快速发展极大地提升了数字电路的集成度和运算能力,同时也对数据转换器的性能提出了更高的要求。Sigma-Delta-ADC利用过采样和噪声整形技术降低带内量化噪
学位
学位
染料敏化太阳能电池(Dye-Sensitized Solar Cells,DSSC)由于其低成本和环境友好等特点,作为第三代太阳能电池技术被人们广泛研究。实验室制备的小面积(面积小于1cm2)电池的最
NLR(nod like receptor)家族是一类新发现的存在于细胞质的模式识别受体家族(PRR,pattern recognition receptor),由于其与植物负责先天免疫识别和危险信号识别的R受体家族具有同
此论文包括两部分工作,主要研究调控T细胞粘附迁移的两种信号分子LRCH1和ADAP的功能。第一部分工作主要阐述筛选出的新型信号分子LRCH1如何限制T细胞迁移的研究。T细胞在趋化
波导不连续性结构在介质特性参数测量、微波波导元件或装置的分析和设计等方面具有举足轻重的作用,因此准确分析波导不连续性意义重大。   作为一类特殊的电磁场边值问题,
学位
近年来,随着无线通信系统的不断发展,微波器件的集成和小型化已经成为器件发展的一种趋势。为了实现器件的小型化,设计具有集成多种功能的单一器件正成为国内外研究的热点。将功
现场可编程门阵列(Field Programmable Gate Arrays,FPGAs)主要由可编程逻辑块、可编程互连以及可编程输入/输出模块组成。其中,可编程互连实现可编程逻辑块之间、可编程逻辑
学位
从沈阳苏家屯地区长期受有机磷污染的土壤中分离到10株以敌敌畏(DDVP)为唯一碳源生长的细菌,其中降解活性最高的菌株经生理生化鉴定和16SrDNA同源性比较,鉴定为甲基杆菌属(Meth
本文利用DETI可移动测风系统对古尔班通古特沙漠半固定沙垄进行了实地观测,结合同期多向集沙和阶梯式积沙试验,系统研究了典型沙垄表面的风速变化和沙面活动规律。得出以下主要