GPGPU并行模拟与低开销片上网络设计

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:tshy65655
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着GPGPU在生物计算、金融分析、天气预测等高性能计算领域发挥着越来越重要的作用,有关GPGPU的相关研究逐渐成为研究的热点。在模拟器设计方面,一个高性能的模拟器对GPGPU的研究而言至关重要,而当前GPGPU模拟器大多为串行模拟器,模拟速度极慢,极大制约了模拟器在GPGPU体系结构研究中的应用。在GPGPU体系结构设计方面,随着GPGPU计算能力的不断增加,GPGPU中越来越多的计算节点需要通过片上网络与存储节点进行通信。随着片上网络在片上多核系统设计中所占的开销不断增大,如何在保持性能不变的前提下设计低开销的片上网络对于GPGPU的发展至关重要。针对于第一个问题,本文提出了GPGPU并行模拟的方案,充分利用现有宿主平台多机多核的计算优势加速GPGPU程序的模拟速度;针对第二个问题,本文提出了GPGPU低开销片上网络设计的方案,首先通过一系列的设计避免了网络中报文的冲突,然后通过简化路由器微体系结构设计降低了片上网络的开销。本文的研究工作和成果有:(1)提出了GPGPU在多核多机平台下的并行模拟方案在多核宿主平台下,本文提出了Kernel内部的并行模拟,一方面使用多个模拟线程同时对多个Cluster进行模拟,并要求多个模拟线程在每个时钟周期进行同步以保持模拟精度,另一方面并行化执行驱动中的功能模拟和性能模拟以弥补时钟同步带来的性能损失。在多机宿主平台下,本文提出了Kernel之间并行模拟的方案,将Kernel函数进行分组后利用多机平台并行的对各组进行模拟以获得性能的提升。在GPGPU模拟器对程序进行模拟的过程中,它会依赖功能模拟提供的结果,因此功能模拟在一定程度上会制约GPGPU模拟器的模拟速度,本文针对CUDA编程模型的特点提出了一种并行化功能模拟的方法,并就它应用到了Kernel内部、Kernel之间并行模拟中。(2)提出了GPGPU低开销片上网络设计方案本文针对GPGPU中Request网络的通信特点提出了低开销的片上网络设计。将计算节点分为若干组,通过向各组分配专属子网避免了不同组之间的报文冲突;设计了令牌发射机制以及令牌传输网络,彻底避免了组内的报文冲突,并对网络不存在任何冲突进行了证明;设计了低开销的路由器微体系结构,实现了报文在相邻路由器之间的单周期传输;设计了状态回传网络,使计算节点可以感知存储节点中报文缓存队列的状态变化,从而进行相应的发包调整。本文对上述方案进行实现,并针对多个CUDA测试集中的测试程序对系统性能进行了详细的测试与分析。实验结果表明了并行模拟方案和低开销网络设计方案的有效性。
其他文献
当前WTO多边贸易体制谈判一波三折,时常陷入僵局,越来越多的国家将贸易政策转向双边FTA。双边FTA迎来了新的发展时期。随着WTO多边贸易谈判进程越来越缓慢,有关双边FTA的制度
近年来,随着中央农村政策的不断深入,农村集体经济得到较快发展,同时,集体经济的发展模式也趋于多样化。如何开展农村集体经济审计,保护农民利益,实现共同富裕和农村经济可持
通过控制电磁波和热流在介质中的传播路径,可以设计许多有潜在应用前景的功能型斗篷,用于实现电磁隐身,电磁幻象,热隐身,热幻象和热防护等效果。研究这些斗篷的形状结构,以及
<正> 为摸索蛋鸡笼养的经验和实际效果,提高养鸡的经济效益,改善农村传统的散放养鸡方式,充分利用农户现有庭院和空地,多养鸡、养好鸡,为家庭蛋鸡笼养提供一些科学依据和饲养
提高高功率微波系统的辐射功率和输出微波频率是顺应高功率微波技术进一步发展及应用需求的必然趋势。目前,高功率微波源已在P、L、C、X等中低波段获得了吉瓦级的微波输出。
目前国内各种电子产品需求飞速增长,每年对集成电路芯片的需求量成几何增长,随着各类电子产品的数码化和大容量化,对芯片的需求还将大幅增长。这使得集成电路芯片的出货量大
金融风险度量的核心是价格波动性的估计和预测。本文以金融市场波动的区制关联性与风险度量为题,在对金融市场波动性模型的理论与方法综述的基础上,对金融市场波动的相关性、
本文将全生命周期理论引入水电勘察设计项目风险管理,创新性地提出了水电勘察设计项目全生命期风险管理的理念。本文在研究分析了水电勘察设计项目全生命周期风险因素和全生
碳化硅作为第三代宽带隙半导体材料,表现出优异的材料特性,且金属半导体场效应管器件频率高、不易发生二次击穿。4H-SiC MESFETs器件凭借输出功率密度大、良好的热传导性和高
研究Nomex蜂窝夹层板力学特性的温度相关性,可以为这种材料在变温条件下的工程应用提供重要依据。本文主要采用实验测试的方法,研究了均匀加热和激光加热条件下Nomex蜂窝夹层