基于自动线程和超长指令的统一架构着色器的设计研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhanggh20060363
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于3G移动终端的3D图形绘制应用,研究可编程的高性能3D图形处理器具有重要意义,而顶点着色器和像素着色器是实现3D图形处理器可编程功能的核心,因此设计功能强、性能高、面积小和功耗低的着色器对于高性能3D图形处理器的开发具有重要作用。本文统一架构设计、自动线程调度和超长指令设计三个方面探讨了研发新一代着色器的技术与方法。在统一架构的着色器设计方面,开发了一套统一的指令集及执行架构,使图形处理器在面积上减小了一个着色器的规模,约为12.1%;同时,为提升多媒体SoC处理器的性能,进一步将统一架构进行扩展,集成了处理视频编解码运算的指令和执行单元以替代固定处理单元,进一步降低了SoC处理器的面积。在自动线程调度机制方面,提出了基于线程、指令两级调度的自动线程调度模型,提高了指令执行的自动化;同时,为进一步提高着色器的性能,又提出基于线程、指令和操作码三级调度的自动线程调度模型,在较大程度上降低了对CPU的依赖。由于相邻指令之间的数据依赖性会降低自动线程调度机制的性能,本文提出了一种有效的数据组织方式,即单点所有元素同步处理方式,以避免大量分支跳转。在基于超长指令字的设计方面,提出长度可变的指令格式,不同的应用处理采用不同长度的指令可以减少对指令缓存和读写带宽的浪费;同时,提出两通路的单操作数多操作的串并行执行架构,以实现对单笔数据连续执行多个操作,指令执行的效率。基于统一架构、自动线程调度和超长指令而设计的着色器,在SMIC5nm工艺下,工作频率可达400MHz,顶点渲染的性能达到300M vertices/s,像素渲染的性能达到400M pixels/s,而平均功耗为248mW,取得了较高的功耗效率和硬件效率。
其他文献
体细胞胚发生途径是细胞全能性表达的最完全方式,深入研究体细胞胚的发生发育过程对于揭示细胞分化、发育、形态发生与合子胚发育等重大理论问题的机制以及真核细胞中基因表达与调节控制等具有十分重要的意义。 防风(Saposhnikovia divaricata(Turcz.)Schischk.)系伞形科多年生草本植物,为国家重点保护的野生药材之一。药用部位是植物的干燥根,具有解热、镇痛、镇静、抗炎等作
随着用电设备对电能质量的要求越来越高,人们对UPS的性能要求也越高。串并联补偿式UPS正是在这个背景下兴起的一种新型的UPS系统。相对于传统的双变换UPS,串并联补偿式UPS在系统构成和电能变换效率上都取得了突破,它既可以对非线性负载时的无功电流以及谐波电流进行补偿,还可以补偿电网电压的谐波及基波偏差,具有系统效率高、过载能力强、输出能力强以及综合的电能质量调节能力等优点。串并联补偿式UPS是符合
研究目的:神经营养素家族是一类由靶组织分泌,具有促进和维持神经细胞生存、生长、分化等功能的特异性蛋白质或多肽类分子。神经营养素-4是第四个被发现的神经营养素家族成员
针对小学数学的抽象性和小学生以形象思维为主的现实性冲突,“层次性体验”是一个很好的教学方式,不仅可以帮助学生直接的感知数学,还能深化学生的认知与理解.本文笔者结合自
本文通过对荣华二采区10
期刊
干旱、盐碱、低温和冻害等非生物逆境严重影响了植物的生长和发育.在逆境胁迫下,植物体内通常会发生一系列的生理生化反应.首先,植物通过多种途径感应环境的变化,并将环境变
如何才能提升高中物理的教学效率?笔者认为,专家有他们的见解,学生有他们的建议,而作为一线的教育者,我们有自己的经验与感悟.通过不断地实践与探究,笔者对此提出的建议是,我
随着电子科学技术的高速发展,便携式电子产品,比如智能手机、电子书、平板电脑、可穿戴设备等电子产品发展迅猛。而智能移动终端通常需要很“干净”的输入电压。所以,一个高性能的电压转换器是不可或缺的。电源管理系统不仅要为便携式电子设备中的各个模块提供稳定、高效、持久的能量,其设计还要符合便携式电子产品小型化发展趋势。开关电容式DC-DC转换器,只采用电容作为储能元件实现能量的转换,相对于电感型转换器而言,
OFDM(正交频分复用)具有频谱利用率高、抗衰落能力强等优点,被认为是下一代移动通信的关键技术之一,并将应用到高铁等高速移动通信环境。在高速移动环境下,信道变成了快时变
本文主要运用蛋白质组学的技术和方法,研究在高温胁迫过程中,外源ABA对长春花幼苗耐热性提高方面的影响及其蛋白质组学基础,揭示了ABA作为重要植物抗逆调节物在提高植物耐热性方