OpenMP并行程序性能分析

被引量 : 0次 | 上传用户:guomingjie000111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着大规模并行计算技术的发展,特别是近期多核技术的不断进步,使得几乎所有的程序员都要设计多线程程序。在并行程序设计领域,OpenMP具有简单易用的特点,因而成为共享主存结构编程的事实标准。然而开发OpenMP并行程序面临着很多性能问题,比如负载不均衡、存储访问效率不高等,因此就需要利用性能分析工具找出造成性能问题的原因和出现问题的位置。现在已有的性能分析工具基本上都依赖于操作系统甚至硬件平台的特性,缺乏灵活的跨平台能力。针对这种现状和实际需求,本文设计并实现了轻量型的跨平台性能分析工具。本文首先建立了OpenMP程序开销分析模型,然后提出了性能分析单元的概念,并借助性能分析单元对负载均衡进行分析,接着定义了基于性能属性规范语言的OpenMP程序性能问题,最后设计并实现了跨平台的性能分析工具。该工具通过自动化插桩源代码的方式对OpenMP程序定义的各种性能问题进行分析;同时借助于硬件计数器来获取程序运行时的底层硬件信息,硬件计数器是处理器中的一组特殊的寄存器,在处理器的工作过程中,这些寄存器中保存着运行时环境的相关数据,通过这些数据可以分析出程序的CACHE失效率等性能特征,性能分析工具使用PAPI来完成对硬件计数器的访问;同时还能够报告出性能分析单元负载均衡程度和进行半自动化的性能退化问题检测。该工具按照模块化构成的思想利用ANSI C实现,不但具有跨平台特性,而且具有良好的灵活性和可扩展性。通过标准的测试程序验证了性能分析工具的有效性,该工具得到的性能日志结果不仅能指出性能问题在源代码中的位置,还能指明性能问题产生的原因,说明该工具有较强的可用性。
其他文献
伴随着我国改革开放进程的不断深入,交流的渠道更加多元化,规模不断扩大,回国发展已成为许多中国海外留学人员的第一选择。陕西省根据本省的实际情况,在吸引留学人员回国创新
为了更好地满足串联磁芯结构的脉冲叠加器充电需求,设计了一款结构紧凑、开关频率较高的全桥LLC变换器充电源,并提出附加平衡绕组的方法,解决了每级储能电容充电电压幅值不一
《汉语拼音方案》是1958年2月由全国人民代表大会通过的国家标准。汉语拼音不仅对国内语言生活发挥了巨大作用,而且对国际语言生活产生了深远影响,因此国际标准化组织在1982
人们从物联网概念的兴起到技术运用落地只用了很短的几年时间。如今,人们普遍认为物联网技术是继互联网和移动通信技术之后,人类信息产业中的又一项革命性的技术。随着我国城
线粒体携带除核DNA外的遗传物质线粒体DNA。由于线粒体DNA的多拷贝,随细胞分裂的随机性,造成了非严谨性的遗传特性。研究发现,线粒体编码的13个多肽在电子传递链中发挥重要作
分析了高校图书馆在留学生信息服务工作方面存在的不足及针对性服务不够等问题,并从开展留学生的相关培训,丰富留学生文化活动,加强馆员的培训和外出学习,增加馆藏资源建设等
本文以在建工程云南梨园大桥——钢筋混凝土箱形截面拱桥为工程背景,应用有限元软件建立模型,对其施工过程、运营阶段进行比较分析,研究以下内容:①以梨园大桥设计图为依据,对其各
神经母细胞瘤(neuroblastoma、NB)是小儿最常见的胚胎性肿瘤之一,是目前威胁儿童生命的主要肿瘤。由于神经母细胞瘤预后差异大,目前倾向于根据患者预后因素采用分级治疗。手术、
数字经济时代,数据隐私保护问题对企业的影响越来越大,很多企业已经把数据隐私保护纳入到风险管理的内容当中,企业隐私管理逐渐向标准化发展。从20世纪60年代至今,数据隐私管
检察机关从2013开始试点推行诉前会议制度,至今这项工作已经开展了5年时间,深入分析诉前会议制度的意义、目的、定位、内容等方面,有助于进一步找准方向,发挥诉前会议在审查