面向科学计算应用的多核处理器Cache划分策略研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:xiangsyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多核处理器在高性能计算领域的广泛应用,面向多核处理器优化科学计算程序性能成为重要的研究问题。当前主流多核处理器均采用共享Cache结构,但线程间的干扰会降低程序的性能。Cache划分技术通过把共享Cache划分给多个独立程序而避免了线程间的干扰。在多道程序环境下,Cache划分能提高系统整体性能、降低失效率、提高系统的公平性。然而对于科学计算程序,Cache划分技术能否提高程序性能,以及如何提高程序性能,仍然是开放的问题。本课题面向科学计算程序,针对上述问题,深入研究了多核处理器的共享Cache划分技术。论文的创新点如下:(1)提出了共享Cache空间冲突模型(SCCM)。针对采用LRU替换策略的共享Cache,SCCM模型可以预测多个进程并行访问共享Cache时的Cache空间占用率、失效率和进程间冲突概率。试验结果表明:SCCM模型不但功能强于传统的Prob模型,而且具有更高的精度。此外,本文还应用SCCM模型分别分析了理想情况下和实际情况下,MPI(Message Passing Interface)程序使用共享Cache时的性能参数。在理想情况下,建模了进程数为2的MPI程序使用相联度为2的共享Cache时的性能参数,并且给出了与使用Cache划分技术相比,Cache共享具有较高失效率的充分条件。在实际情况下,应用SCCM模型分析了实际MPI程序的Cache空间占用率、失效率和进程间冲突概率。最后得出结论是:Cache划分技术可以提高MPI程序的性能。(2)面向负载均衡的MPI程序,提出了共享Cache空间划分技术(SLCP)。SLCP根据失效率监控器(MRM)收集的失效信息,使用性能预测模型,把Cache划分问题归结为规划问题;并且根据MPI程序所包含进程的IPC曲线是否都是非降凸函数,把规划问题分为两种情况求解。针对SLCP有可能会导致程序负载不均衡的问题,在SLCP基础上提出了共享Cache时间划分技术(TLCP),TLCP在时间维度上进行Cache划分,以保证MPI程序的负载均衡。本文使用NPB测试用例,对SLCP和TLCP进行了详细的评测。评测结果表明:对于工作集较大的负载均衡的MPI程序,SLCP和TLCP在多数情况下会取得相同的性能加速,少数情况下SLCP会产生负载不均衡的问题,此时TLCP能够解决负载不均衡的问题而获得更多的性能加速。(3)面向多个OpenMP程序组成的多道多线程程序集合,提出了加权共享Cache划分技术(WCP)。现有的面向多道程序的Cache划分技术多以进程为单位进行Cache划分,但是在划分过程中没有考虑到不同进程包含线程数目的不同。WCP基于传统的失效率最优的Cache划分技术,考虑到线程数目对共享Cache划分的影响,在Cache划分时根据进程包含的线程数目赋予其一定的权值。试验结果表明:WCP虽然使失效率有所增高,但却改进了IPC吞吐率、加权加速比和公平性。(4)面向负载不均衡的MPI程序,提出了基于Cache划分的两级负载均衡框架(CPTLLBF)。CPTLLBF利用程序运行时实时提供的负载均衡信息,动态地进行基于Cache划分的负载均衡操作(包括局部负载均衡和全局负载均衡)。局部负载均衡在多核处理器范围内,为在其上运行的进程组进行共享Cache划分,从而做到多核处理器范围内的负载均衡。全局负载均衡适用于MPI程序使用的所有多核处理器,根据进程对共享Cache的需求,动态地把进程映射到不同的多核处理器上,并对MPI程序所使用的每个多核处理器分别进行局部负载均衡,以保证系统范围内的负载均衡。实验结果表明:CPTLLBF可以有效降低负载不均衡的MPI程序的执行时间。
其他文献
随着闪存技术即将达到尺寸极限而面临无法等比例缩小的问题,一种基于材料电阻转变特性的电阻式存储器(RRAM)由于其结构简单、可缩微能力强、高速、高密度、可三维集成以及与C
随着社交网络服务(Social Networking Services,SNS)的快速发展和日益成熟,互联网已逐渐步入社交时代。据中国互联网络信息中心统计,2015年上半年,中国使用SNS的用户人数已超
伴随电力领域持续的发展进步,以及社会电能供应求方面的逐渐增加,电能计量设备的维护以及检查工作难度逐渐升高,而伴随自动化工艺的持续进步升级,各个领域行业当中对自动化系
工程索赔管理是项目管理的重要组成部分,也是合同双方法定权利及维护自身经济利益的手段.建设工程索赔在维护当事人特定权益,减少工程损失和提高经济效益等发面发挥着非常重
嵌入式应用的发展要求嵌入式微处理器具有高性能、低功耗、结构可扩展、成本低和设计周期短的特征。嵌入式微处理器体系结构及设计方法因此而面临着极大的挑战。在当前集成电
随着硬件技术的飞速发展,内存价格越来越低,大内存容量已成为数据库服务器的标准配置,这在很大程度上缓解了数据库查询执行的磁盘I/O代价,也促进了内存数据库的普及应用,给数
利用相关文献及来自酸沉降网的中、日两国各观测站点的SO2监测资料,分析了近十年来中国SO2的污染现状、趋势及排放量对下风向日本各观测站点SO2浓度及硫沉降量的影响。结果表
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
奥库贾瓦及其长篇小说《废置的舞台》(译后记)武学善布拉特·沙尔沃维奇·奥库贾瓦是原苏联著名的诗人、作家,1924年出生在莫斯科的一个党务工作者家庭。他的父亲是格鲁吉亚人,母亲是
随着我国城市建设的不断快速发展, 我国的城市建设取得了较高的成绩, 尤其是在我国的城市园林绿化方面更是取得了长足的发展.随着我国城市园林绿化建设的不断多元化, 园林植