嵌入式GPU中统一染色器核的研究与设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:chyfandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图形处理发展的目标始终是在计算机上呈现出更好的显示效果。为了满足人眼对这一目标的需求,图形处理系统需要更快的计算速率,更大的数据吞吐率,更高的显示分辨率,更多的色彩和场景细节。此外,嵌入式设备不断被寄予更高的希望,比如手机,人们不仅仅满足于发短信、打电话和上网等功能,更希望它能成为一台优质的游戏机、电视机等等。综上,因为人们对于嵌入式GPU的需求日益增长,所以自研GPU芯片的工作迫在眉睫。本文的研究对象就是图形处理GPU芯片,通过对国内外现有产品和技术的一系列学习研究,最终使用VerilogHDL语言实现了嵌入式GPU中的统一染色器核。这是GPU能够高效并行计算的关键技术,也是GPU芯片中最为重要的部分。本文在第二章详细描述了设计的相关准备工作:首先概述了 GPU研究的意义以及国内外对GPU研究的历史和发展情况。然后通过系统地分析图形管线的发展,确定了本文使用的是统一架构的图形管线,再就业界先进GPU厂商的统一染色架构产品进行了详细研究。最后根据染色器核要实现的具体功能主要研究了顶点坐标转换和光照计算的关键算法。本文的第三、四章从架构设计到模块设计,详细介绍了统一染色器核的具体实现方法。首先是32位精简指令集的设计,事实上,每一个染色器核都能实现全部类型的运算,而在实际使用中,将各个计算核进行编程并对数据进行加载和存储的操作,正是通过灵活的指令集体系来完成的。然后介绍了统一染色器核的架构设计方案,根据SIMT的软硬件协同调度技术实现了多线程的高度并行,根据指令执行的五个阶段优化了五级流水线。最后,为了提高统一染色器核的处理效率,在通用实现方案的基础上,重点研究了指令双发射的实现方法以及光照计算单元的实现方案;因为五级流水线中发射阶段最为复杂,一般处于时序的关键路径上,所以特别针对发射方案进行了优化;而光照计算量大且计算复杂,所以设计一个专门的计算单元用于处理专门的光照指令,也是对执行效率的重要提升。最后,本文对统一染色器核的所有逻辑设计进行了虚拟平台验证(包含模块级验证和系统级验证两部分),并给出了相应波形和分析结果。另外还进行了 FPGA验证,以更真实的电路对设计的功能进行了验证,FPGA的综合过程也呈现了代码的实现情况、资源使用情况和时序约束情况,对性能方面的简单分析也证明了本设计满足了预期的设计目标。实验结果证明了本文设计的GPU芯片中的统一染色器核能高效的完成相应图形处理功能,达到预期目标。
其他文献
夏天的一个夜晚,睡得香香的小朵琳,突然被吵醒了。深更半夜的谁在嚷嚷呢?难道大眼爸爸和小腰妈妈吵架了?她打开灯,爬起床,决定去看个究竟。小朵琳贴在窗户上仔细听着,声音好
期刊
高校毕业生就业难的现象已经成为了社会各界共同关注的焦点之一,如何使高校毕业生顺利就业,高质量就业,关系到人才强国战略的实施,关系到社会的和谐稳定发展,更是关系千家万户的切
SARS疫情在中国大陆的迅速蔓延已使大众经历了恐慌,抢购及逃亡风潮,面对神秘不可知的传染途径,疫区城市的百姓多选择了自闭于户。在这种情况下,手机短讯、互联网通讯量急剧上升、
<正> ERP在中国经历了20多年的风风雨雨,市场的变化从狂热到冷静,从盲从到理智,我们的企业吃过很多亏上过很多当,积累了相当的经验和教训。从总体来说,中国ERP市场逐渐成熟,
随着改革的逐步深化,农业生产力的不断提高,农村剩余劳动力的数量越积越多,形势越来越严重.文章着重分析攸县劳务输出不断发展的原因、现阶段存在的问题及相应的对策.
用有限元法计算了阶梯杆的位移,用功能强大的数学软件Mathematica来进行数学验证.
时间和空间一直是人类生存与发展的两个基本维度,回顾人类发展的历史进程,发现关于人类生存与发展的研究脉络中,往往注重时间的维度与路径而对空间这一重要维度的关注尚不足
似乎人们都习惯赶在一年即将结束的时候去完成些什么或者筹措些什么。新旧年度交替之际,国际局势的风云变换强化了人们的这一传统印象。俄罗斯莫斯科人质事件的枪声未息,美国倒
哦!亲爱的同学们,我都忍不住要给大家推荐这本书了——明天出版社出版的《随风而来的玛丽阿姨》。看到这个题目,你是不是跟我一样在想:玛丽阿姨究竟长什么样子?她怎么可能随
文章简要介绍了湖南湘牛环保实业有限公司开发研制的专利技术产品微动力生活污水处理装置,并研究通过改进微动力生活污水处理装置的性能,使之成功地运用于工业废水处理中,充