EGPU处理单元的研究与设计

来源 :山东大学 | 被引量 : 0次 | 上传用户:xjfox1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
嵌入式图形处理器(Embedded Graphics Processing Unit, EGPU)是高性能嵌入式平台中必不可少的组成部分,无论是智能手机、平板电脑,还是其他嵌入式设备,高效的图形处理及数据运算能力已经成为基本需求,都需要经由高性能EGPU处理并呈现给用户。游戏场景渲染、高清视频处理、高性能并行计算等众多的应用需求推动了EGPU的快速发展,对其架构设计和优化提出了迫切的需求。由于嵌入式系统在面积、功耗和灵活性方面的限制,使得高性能低功耗的EGPU设计正逐步成为领域内的发展重点。随着半导体制造工艺进入后摩尔时代,通过提升频率及增加核心数量的方法获得性能增长的代价越来越高,需要进一步研究EGPU处理单元的架构与算法优化来提升处理性能,这是EGPU研究的关键问题,具有重要的研究意义与应用价值。本文以EGPU处理单元的研究与设计作为重点,首先对计算机图形学原理及图形渲染算法进行了介绍,明确EGPU处理单元在图形渲染的过程中所发挥的作用;随后对GPU和EGPU设计架构进行了分析和研究,探索适合嵌入式平台的图形处理硬件加速单元结构,使其在性能和硬件开销上取得平衡。在此基础上,本文提出了一种硬件加速单元UPE(Universal Processing Engine),作为EGPU的处理单元。UPE采用统一渲染模型,可以同时用于3D图形处理和通用计算。UPE中包含2个统一处理器UP(Universal Processor)和一个控制单元UPC(Universal Processor Controller).UP中包含4个流处理器SP(Streaming Processor)和一个特殊函数单元SFU(Special Function Unit),用于完成图形处理和通用计算。UPE硬件加速单元的主要创新点包括:采用指令打包多发射结构以提升硬件利用率,动态地平衡各处理单元之间的负载;采用层次化处理结构实现硬件线程级别的并行处理,提升处理性能;通过灵活的总线访问机制和存储结构设计有效的减少了数据访问和处理的延迟。本文完成了UPE硬件加速单元的设计和逻辑综合。基于课题组前期搭建的嵌入式图形处理器HDL平台对UPE进行验证,采用Synopsys公司VCS+Verdi作为验证工具,以Testbench+DUT的方式进行验证。在CSMC018工艺下对UPE进行了逻辑综合和时序分析,在200 MHz的时钟下,UPE的浮点处理能力达到1GFLOPS,最优情况下图形处理性能为100M顶点或者像素每秒,平均处理能力为56M顶点或者像素每秒。同时,其功耗为198.228mW,面积约为27mm2。仿真结果表明本文所提出和设计的UPE硬件加速单元可以应用于嵌入式处理平台,作为EGPU的处理单元,对所建立场景中顶点数据进行正确的处理,完成场景渲染,并能够正确高效的完成通用计算处理,在性能和硬件开销方面达到较好的平衡。
其他文献
目的:观察上肢骨折患者在手术过程中联合应用右美托咪定与臂丛麻醉具有的麻醉效果.方法:选取92例来我院接受手术治疗的上肢骨折患者,按入院顺序将其分成2个小组,接受咪达唑仑
目的:探究脊柱损伤康复恢复中采用螺旋CT与核磁共振检查的应用效果.方法:纳入的108例脊柱外伤患者都来自本院2015年10月-2017年12月期间,对本院108例脊柱外伤患者手术6个月后
目的:探讨改良夹板外固定治疗桡骨远端骨折的临床疗效.方法:回顾性分析2017年1月-2018年12月本院收治的106例桡骨远端骨折病人的临床资料,其中采用改良夹板外固定法治疗的56
靶标昆虫中Bt受体蛋白主要有两类:氨肽酶和类钙粘蛋白.文献报导显示类钙粘蛋白更有可能是昆虫的Bt毒蛋白的主要受体.Bt-R3受体基因是吴志平博士在其博士论文研究中新克隆到的
目的:探究患者的年龄、血红蛋白含量、吻合动静脉比例对断指再植成活率的影响.方法:本院2016 年8 月-2018年12月的150例断指患者210指,进行断指再植手术,并在术后接受医院护
巨噬细胞集落刺激因子(M-CSF)又称为集落刺激因子-1,是造血系统重要的细胞因子.为研究核内M-CSF的功能,该文采取定位表达的方法使M-CSF在细胞核内表达,研究对细胞功能的影响.
目的:探究显微外科再植治疗手指旋转撕脱离断伤断指的治疗效果.方法:回顾性分析我院于2016年9月-2018年9月期间接受了显微外科再植治疗的本病病人48例的临床资料、治疗方法以
目的:对比探析FARES法与Hippocrates法在肩关节前脱位中的治疗效果.方法:选取2017年3月-2019年3月在本院进行治疗的70例肩关节前脱位患者作为观察对象,按照入院顺序将其分为
SAGA(Spt-Ada-Gcn5 Acetyltransferase complex)是一个多亚基保守的转录复合物,在裂殖酵母(Schizosaccharomyces pombe)里由19个亚基组成,调控体内10%基因的转录。为了进一步研
该论文采用透射电镜技术比较研究十足目(Decapoda)物种浙江华溪蟹(Sinopotamon chekiangense)、三疣梭子蟹(Portunus,trituberculatus)、脊尾白虾(Exopalarmon carinicanda H