NUMA架构下多线程访存分析系统与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:freebird23
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非一致性内存访问(NUMA,Non-Uniform Memory Architecture)架构是目前主流的高性能服务器架构之一。NUMA架构的主要特点是访存延迟的不一致性,即处理器访问本地内存所需时间比访问远程内存少。从处理器到其本地内存的访问不仅更快,而且能减少造成节点间互联链路和各节点内存控制器拥塞的可能性。在NUMA架构下运行多线程程序时,如果没有很好地将多线程程序的线程和数据协同存放,该多线程程序可能经历相当大的访存延迟。因此,提出NUMA架构下的多线程访存分析机制对提升程序性能具有重要的意义。新的机制以多线程程序中各个变量作为研究对象,采用变量平均访存延迟作为识别NUMA问题的指标。若判断出可能存在NUMA问题,则通过变量平均访存延迟以及变量访问比例找出受NUMA架构造成的问题影响最严重的变量,根据应用程序中对于该变量的线程访问模式来了解并解决问题。基于该机制的多线程访存分析系统首先采用硬件采样机制对程序运行时执行的访存指令进行采样,包括指令的发起线程、目的变量以及所花费的时钟周期等信息;其次,据此计算程序中所有变量的平均访存延迟并排序,依据访问比例找出最具优化价值的变量;最后,总结出多线程对该变量的访问规律,从而协助用户提出针对该变量的具体优化方法。这种以数据变量为中心的分析机制,不仅能较精准地探测到NUMA架构下程序中的访存延迟问题,而且能够针对变量解析多线程程序对其的访问模式,从而准确地找到解决该问题的优化方案。测试结果表明,对于NUMA架构下运行的多线程程序,该机制能够识别出各种NUMA架构造成的访存问题,并能够检测到多个线程访问数据的各种不同模式,通过相应的优化手段,能够取得高达51.92%的性能优化。
其他文献
目标识别是计算机视觉的重要研究课题,而交通灯识别和阴影识别是目标识别中当前研究的热点问题。实时交通灯的识别在辅助驾驶和无人驾驶汽车方面有广泛的应用;而阴影消除关系
关联规则挖掘是数据挖掘领域中一个重要的研究方向,它可以在海量数据中揭示某些特定的规律,辅助决策者进行决策。作为关联规则挖掘中最耗时的部分——频繁模式挖掘,其算法的
随着计算机技术的飞速发展,各行各业对软件开发的效率、质量以及后期维护都有了更高的要求,然而传统的以数据库为核心的软件开发方法并不能很好地满足这些需求。领域驱动设计
虚拟化技术的广泛应用引发了对虚拟化环境下性能分析工具的需求。如不同虚拟机里的用户需了解运行在该虚拟机的程序的性能问题,以便优化程序性能及运行环境配置。这都需要对
近年来,社交网络呈现爆炸式的发展,其对现实社会产生越来越深远的影响。社交网络上活跃着数以亿计的用户,蕴含着海量的数据,对社交网络中用户影响力进行量化研究,有助于了解
从上个世纪九十年代起,基于运动数据捕获的运动合成,就一直在游戏和动画领域扮演着举足轻重的角色,并一直是计算机图形学领域研究的热点。其中,运动图技术因其可靠性,在基于
图像融合技术能将同一场景的多幅图像融合成一幅更少噪音、更多信息、更能满足应用需求的新图像。近年来,图像融合技术取得了丰硕的成果。图像融合技术被广泛应用于地球遥感、
云计算作为一种以网络为基础的计算模式和服务提供方式,一方面,它集中了C/S计算、对等计算、分布式计算、协同计算等计算模式的优点;另一方面,它屏蔽了各类终端在cpu处理能力、存
合成孔径雷达(SAR)是一种高空视觉系统,具有全天候、远距离、极强的穿透力和高分辨率等特点。针对SAR图像的目标识别已成为国内外研究的热点,而如何精确地提取图像特征和采用
省级府各个部门正积极建设各自的应急平台,但是由于早期没有统一的规划,各个单位或者部门的应急系统采用了不同的系统环境和实现技术,导致了“信息孤岛”的形成,异构应急平台间的