一款嵌入式GPU的访存建模

来源 :东南大学 | 被引量 : 0次 | 上传用户:zxg520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,嵌入式GPU的处理性能越来越强,但它受到“存储墙”的限制也越来越大。本文以GC430嵌入式GPU为研究对象对嵌入式GPU的访存特性进行分析研究,并建立了面向嵌入式GPU的访存信息发生器模型。主要意义(1)所获得的访存特性能够为面向嵌入式GPU的访存调度策略的优化提供依据;(2)访存信息发生器模型可以快速生成具有目标访存特性的访存信息流,能够对存储控制控制器的调度策略优化和存储空间设计探索等研究进行快速有效性验证。  本文以RTL级仿真的方式获取GC430嵌入式GPU的访存信息流,按照GPU各数据缓冲区地址空间的不同,将GPU在各缓冲区上的访存信息流剥离开,然后分别从时间维和空间维两个方面统计分析嵌入式GPU总体和在各个数据缓冲区上的访存特性。时间维度主要统计分析各访存信息流的访存请求到达时间间隔分布等特性,空间维度主要统计分析各访存信息流的连续行命中次数分布等特性。然后依据上述访存特性,建立嵌入式GPU的访存信息发生器模型。该模型可以通过修改模型的配置参数输出不同访存特性的访存信息流。发生器模型输出的每条信息对应着每个GPU访存请求,包含了该访存请求的到达时间,读写方向、访存数据的大小和目标访存地址等信息。  本文对所建立的嵌入式GPU访存信息发生器模型进行了验证,在相同配置的DRAMSim2 DDR高层仿真模型下,对比发生器模型新生成的访存信息流和通过RTL级仿真获取的原生访存信息流的访存特征,包括行冲突率,有效带宽,访存延迟。最终的对比数据显示,行冲突率的平均误差是4.73%,有效带宽的平均误差为5.15%,访存延迟的平均误差为13.1%,说明了该访存信息发生器模型在快速生成访存信息流的前提下,它与真实的嵌入式GPU访存特性在时间维和空间维都基本相适配。
其他文献
本文通过对荣华二采区10
期刊
运动估计是视频编码中的关键模块,用于消除视频数据的时间冗余。运动估计需要从搜索窗口中寻找最佳匹配,以减少残差数据,因此,作为衡量目标块和候选块的相似度的匹配标准,对
随着工业自动化的程度越来越高,高压VDMOS器件的作用正日益显现出来。根据本课题组研究工作可知,VDMOS功率器件的研制在我国还属于起步阶段,对于高压VDMOS的研究还不够成熟。因
红外技术具有:体积小、耗电少、成本低、性能稳定、不用专门申请特定频率的使用执照等优点,因此,随着红外技术与集成电路产业的迅猛发展,越来越多的领域及产品采用红外技术作为遥
芒草是一类高大禾本科植物的统称,广泛分布于我国南北各地,具有生物量高、适应力强、纤维品质优良等优点,被公认为最具潜力的能源植物之一。本文主要通过以下几个方面对芒草进行了研究:对芒草种质资源进行采集、对其形态学农艺性状比较:采用了ISSR方法对不同采集地点的105份芒草材料的遗传关系进行了研究。研究结果如下:1、不同来源地的芒草的形态学特征有一定差异,在统一种植两年后其形态特征具有趋同显现。其中43
随着飞秒激光技术的发展,激光强度大幅度提高,使激光与物质相互作用进入强场领域。超强超短激光脉冲与物质相互作用产生X射线激光主要有两种机制:一种是利用光场感应电离产生的
随着信息化的快速发展,各企事业单位逐步建立起很多信息化系统,这些不同时期、不同部门建立的信息化系统往往相互独立,所使用的数据库产品也往往各不相同。这就形成了各企事
暗下萌发的种子出土后,光诱导了植物生命周期中十分重要的生长发育转变,称为光形态建成。植物能否顺利完成由暗转光的形态转变决定了其是否能够存活。光形态建成中,子叶的叶
1,7-二磷酸景天庚酮糖磷酸酶(SBPase)是植物卡尔文循环中的一个关键酶,它参与了植物的光合碳同化过程。在本项研究中,发现在拟南芥离体叶片中,由甲基紫精(MV)和高温处理引起的氧
在说话人识别领域中,基于模型的方法是最有效的,概率统计模型属于该类方法,GMM和HMM都是典型的概率统计模型,目前,受到十分广泛的研究,具有越来越重要的研究意义和实用价值。