嵌入式GPU的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:sizhezang1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着半导体工艺以及芯片设计水平的不断进步,电子设备的性能取得了极大提高。嵌入式应用终端得到了空前的发展,其能够处理的数据量更大,覆盖的领域更为广泛,一些原本只能在PC机上实现的应用,也已出现在嵌入式设备中。另一方面,人们对于嵌入式设备的应用也提出了更高的要求。以手机为例,人们已经不再满足于简单的通话、短信、视频播放等功能,而是希望手机能够提供更强大的功能,如3D游戏、网络直播、立体视频处理等。这些原本PC机中由图形处理器(GPU)完成的应用不仅需要强大的计算能力以及大数据的处理,更需要低功耗、低成本以适应不断发展的嵌入式系统需求。嵌入式GPU正是为了满足这些功能而设计的,是专用于嵌入式终端或者手持设备上的图形处理器。与PC机的GPU相比,嵌入式GPU需要同时兼顾高性能、低功耗、低成本等特点。本文针对嵌入式应用的特点,对嵌入式GPU的算法需求及架构进行了研究,完成了一款基于统一着色器架构的嵌入式GPU设计。本文首先介绍了图形学的相关背景知识,介绍了GPU的发展历史及现有GPU设计的主流趋势。接着,介绍了图形学相关的基础算法原理,包括坐标变换、图元组装、光栅化、插值以及纹理贴图等。然后,介绍了图形驱动的相关背景知识,包括OpenGL和D3D这两种使用最广泛的图形接口API。本文还介绍了OpenGL ES图形库,该库是OpenGL推出的针对嵌入式终端系统的图形驱动库。嵌入式GPU设计主要包括架构设计,流处理器设计,指令处理模块设计,存储器设计以及几何处理模块设计。嵌入式GPU采用统一着色器架构,可以有效的提高图形处理效率和资源的利用率,利用可编程方式实现顶点变换,光照计算,纹理贴图等功能。流处理器的设计包括核心计算单元CU设计,流水线设计,以及存储结构设计。本文设计的流处理器包含8个CU模块,每一个CU单元能够同时实现4个32位的单精度浮点计算。8个CU单元构成8级流水线结构,有效的防止了各个CU单元访问存储器产生的冲突。本设计中的嵌入式GPU采用了全新的指令集,指令包含了3D处理的各种操作以及3D流程控制。几何处理模块的设计包含了3D处理流程中的图元组装、视口变换、光栅化和插值操作等模块。最后,本文对所设计的嵌入式GPU进行了功能仿真,包括模块级仿真和系统级仿真,并给出了仿真波形以及结果,同时对结果进行了分析。另外,采用Synopsys公司32nm工艺对嵌入式GPU进行了物理设计,并给出版图设计结果。实验结果表明,本文设计的嵌入式GPU能够很好地完成了3D处理,其功耗大小为54mW。
其他文献
专利间接侵权问题在我国一直以来都备受争议。我国专利法第十一条对专利的直接侵权做出了明确的规定,但是却并未涉及专利间接侵权的问题。根据我国专利法的规定,专利权人所能
<正>崔峦老师在全国第八届阅读教学研讨会上指出:"中年级要继续加强识字写字教学。但是要体现由扶到放,适当点拨。因为中年级的孩子有一定的识字能力了。中年级还要加强词语
目的:动态监测接受HAART第一年期间HIV/AIDS患者口腔表征、口腔念珠菌状态,以及外周血CD4+T淋巴细胞计数、CD4+/CD8+比值,探讨HIV/AIDS患者在HAART过程中口腔表征、口腔念珠菌负
<正>《易》曰:"蒙以养正,圣功也。"蒙童养正是指童稚上学应先培养其端正的心性和行为,让其正心、正德、正见、正行,以奠定孩子一生勤学敬业、平和处世、幸福成功的基础,这无
《乌苏里船歌》是一首欢快、甜美反映赫哲族人民过上幸福生活后心情格外开朗的东北民歌。郭颂等在创作中吸收了《想情朗》等闻具代表性的赫哲族传统民间曲调。。
<正>一、美景导入,初解题意师:同学们,我来自一个美丽的地方,请大家看屏幕。(出示松山湖的图片)师:同学们,你看到了什么?生:花、草、灯笼。师:美不美?生:美。师:猜一猜,老师
<正>语言文字是人类情感表达和文化传承的载体,本身又是一种精神和文化现象。汉字是中华民族经过几千年创造和发展起来的文字,承载着历代中华民族的情感和精神,体现了独特的
在现已报道的光催化材料中,二氧化钛因为具有廉价、无毒、较好的化学稳定性和较高的光催化效率等优点,被科学工作者们广泛应用。本论文研究了制备过程中的可控条件对二氧化钛光
以中医理论为指导 ,结合类风湿性关节炎的现代研究 ,探讨了类风湿性关节炎的中医病机 ,即气血不足 ,营卫失调 ;脾胃虚弱 ,湿浊内生 ;痰瘀互结 ,脉络阻滞 ,并论述了该病机的临