众核模拟器并行框架的改进及优化

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:luoxuefubai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多核处理器现在已经被广泛应用,但是大多的传统体系结构模拟器都仍然是串行运行的。众核的体系结构仍然在摸索创新中,我们需要一个有效的加速方法,用尽可能少的改动加速原有的串行模拟器,使模拟器能获得更快的模拟速度。   SimK模拟框架是一个高效的、高度优化过的PDES的模拟框架,进行适量的改进,可以适用于众核芯片模拟的并行化。本文完成了在Godson-T众核模拟器上整合SimK,成为并行运行的P-GAS模拟器的工作。   本文提出了一种对众核芯片模拟器模块进行有效划分的方案。对模拟器模块进行并行化划分时,不仅仅应该从芯片模块的逻辑功能出发,更应该考虑模块的物理位置、通信量和并行后的负载平衡等的考虑。   并行框架的同步向来是开销很大且很难解决的问题,处理不当就会造成死锁等很麻烦的异常情况。本文在对串行模拟器GAS进行并行化的过程中,提出了在时序精确的芯片模拟中可能出现的0延迟事件对PDES同步方式的影响,以及会造成的错误。在发现问题的同时,提出了一种有效可行的解决方法:0延迟计数器。通过PE对“被动事件”的记录,准确得到何时应该步进到下一个时钟周期的信息。这种方法既不影响整体性能,又能完美的解决问题。   除了同步,消息传递也是并行的附加开销中不可忽视的一项。本文基于Godson-T模拟器的统一消息格式,对SimK的消息传递机制进行了优化,大量减少了消息传递的操作次数。对跨进程和跨宿主机等的大型模拟规模来说,这种优化所得到的效果更加明显。   测试数据显示,运行Splash-2测试集,与串行版本相比,16线程的并行版本能达到平均10.9倍最高13.6倍的加速比,而时钟精确度差异平均不到0.1%。而且,由于减少了插入队列的开销,在单线程运行时能够达到超线性加速比。我们得出了PDES可以作为时钟精确的众核模拟器并行化利器的结论。
其他文献
作为当代数控系统主流发展趋势,开放式数控系统要求其人机界面具有二次开发的功能。所谓的二次开发是指界面系统提供专用的软件系统和方法,使用户能够根据自己的实际需要,按照规
在网络环境下,档案利用工作面临着全新的机遇和挑战。传统的档案信息服务已经经不起浪潮般的信息冲击,而网络服务的无地域性、无时间性和全方位、多层次的优势又再次把档案信
解决追及和相遇问题,多数时候都是采取数学和物理处理方法解答,而模型法则恰恰蕴含着两个方法的完美结合.但是要想解决好此类问题,还需要找准问题破解的关键点,找出两种物体
伴随着互联网的飞速发展,人们对信息形式的需求不断的丰富化、多样化。而能够为客户提供高质量图像、声音等娱乐休闲服务的流媒体点播系统,以其客户可以根据需求自由选择播放
随着计算机与互联网技术的发展,互联网上的数据迅速膨胀,其中视频数据更呈现指数级别的增长。视频数据内容丰富、数量巨大、结构多样,给用户检索带来极大的挑战,用户越来越难
作为计算摄影领域的一个重要发展方向,光场成像技术取得了快速发展,其多视角、重聚焦、深度计算等光场特性极大地推动了计算机视觉和数字成像领域内的研究进展。与传统成像技术
课堂的构建需要物理老师积极开动脑筋,发挥自己的智慧,站在课堂主导者的高度进行课程改革的设计,驾驭课堂,调动学生学习的积极性.教学过程中,教师创设有效的教学情境,激发学
信息技术经过几十年的飞速发展,新的计算机技术不断涌现,随着企业对信息技术的重视程度的逐步提高,逐渐建立了各自的信息管理系统,企业的信息化程度也不断提高。但是很多企业
随着互联网的日益普及和迅猛发展,互联网产业取得了前所未有的成就,互联网广告也表现出巨大的发展潜力和上升空间。因此,互联网广告技术越来越受到研究人员和业界人士的广泛关注
亲自参与社会生活实践,会获得一定经验,即个体活体验.它有感官性的,也有情感性的,有劳动实践类的,也有精神思维类的.生活体验对人全面发展至为重要,物理学本身也来源于自然、