面向媒体算法的粗粒度可重构PE及PE阵列架构的设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:zjx000a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术的发展,图形、图像和视频编解码等数据密集型算法得到了广泛的运用,其标准也不断更新。通用处理器(GPP)能很好的解决算法多样性的问题,但其计算能力有限;ASIC可以针对特定算法进行能耗和性能优化,但无法满足不断更新算法标准的time-to-market要求。可重构阵列(RCA)和RISC处理器组合成的粗粒度可重构处理器在灵活性和高性能间可获得良好的平衡,因此适合处理多媒体算法。   论文分析了H.264等媒体算法中核心子算法,包括运动补偿(MC)、去块滤波效应(Deblocking)和反离散余弦变换(IDCT)等。这些子算法基于宏块和块操作,计算复杂度高、数据规则且依赖性强,适合在计算资源丰富的可重构阵列上运算。论文对可重构阵列的各项关键技术作了设计空间探索,设计了适应媒体算法的粗粒度可重构阵列。该阵列在计算单元、互联方式、耦合方式和可扩展性等方面进行了优化,包括:计算单元(PE)支持多种算术运算及逻辑运算,支持媒体算法中常见16位、8位数据位宽;阵列由8×8共64个PE构成,PE间采用crossbar的互连方式;阵列采用总线方式与RISC主控核的耦合,可以作为IP连接到总线上;阵列设计为可扩展形式,以针对不同应用扩展其规模,例如4个8×8阵列可扩展为16×16的阵列以实现H.264高清解码中关键算法。   将本文设计的可重构阵列应用于REmus2可重构计算系统中,搭建验证平台,通过映射H.264核心算法的方式对可重构阵列进行性能评估。实验结果表明,在TSMC65nm的工艺下,时钟频率200MHz时,本文设计的可重构阵列的面积为8.823mm2;平均在816个周期内能完成单个宏块的解码,可实现分辨率为1920x1080的H.264 High Profile码流30帧/秒解码:解码的功耗小于50mW。
其他文献
党的十九届四中全会审议通过《中共中央关于坚持和完善中国特色社会主义制度、推进国家治理体系和治理能力现代化若干重大问题的决定》,这是从政治上、全局上、战略上的全面
期刊
“1成首付新车开回家.”2018年9月,李芷(化名)通过“弹个车”平台买了一辆MG名爵豪华版.一年后她发现,自己买的车竟然变成了租的.记者通过“弹个车”APP预约了北京不同的5家
期刊
在习近平新时代中国特色社会主义思想指导下,落实党中央关于加快建设海洋强国、制造强国、科技强国和形成军民融合深度发展格局、建设具有全球竞争力的世界一流企业、建设世
期刊
多米瑞公司研究的重点领域是国内短缺而又临床亟需、开发技术难度大的多肽药物.目前多肽药物已广泛应用于肿瘤、肝炎、糖尿病、艾滋病等疾病的治疗,全球各大药企也纷纷将多肽
期刊
12月17日,国家发改委新闻发言人在新闻发布会上披露,为了规范有序推广PPP模式,国家发改委在原有PPP项目库基础上,指导各地依托全国投资项目在线审批监管平台,建立了全国PPP项
期刊
学位
随着全球对能源需求的日益增大,地震勘探由简单平缓地区向复杂构造地区发展。复杂构造地区的地震勘探需要计算精度更高、计算效率更好的深度域成像,大倾角等复杂构造需要大偏移
一方面,美国驻伊拉克大使馆遭到攻击,伊朗名将在巴格达遭空袭致死,美国制造业PMI指数连续五个月处于荣枯分水岭50下方……另一方面,特斯拉对中国市场充满信心,在上海设立的“
期刊
本研究应用传统遗传学方法,分析了新纤维发育突变体GZnn的遗传方式,确定了GZnn是受一对隐性基因控制的质量性状。并利用SSR分子标记技术将该光子基因定位到10号染色体上,与已经发现的光子N_1(位于12号染色体),n_2(位于26号染色体)所在染色体不一样,鉴于美国近年新发现了n_3光子基因,故将我们发现的新的隐性光子基因命名为n_4,该光子基因与分子标记sloc1紧密连锁,距离为10.8cM,
过去二十年来,随着MEMS技术的发展,硅微陀螺仪作为检测角速率或者角度的传感器,受到越来越多的关注,产品已应用于图像稳定系统,汽车安全系统以及导航与制导系统等。当输入角