论文部分内容阅读
11月12日,第40届全球高性能计算机500强(TOP500)排行榜发布。这次的榜单与以往相比略显不同,一方面今年是这份榜单诞生的20周年纪念,此外,这回的榜单上出现了与以往不同的新生力量。
在最新TOP500排行榜上,有379套上榜系统采用了英特尔处理器,榜单中还新增了 7套基于英特尔至强融核协处理器的上榜系统,其中包括排名第七位的Stampede系统,其计算速度达到了2.66PFlops(千万亿次浮点计算每秒)。至强融核协处理器基于英特尔集成众核(MIC) 架构,在高度并行化的应用方面能够提供出色的性能。在英特尔公布的一份资料中,中石油南京物探院总工程师赵改善介绍,该院的叠前深度偏移应用在至强融核上的性能提升了2.53倍。
挑战GPGPU
在2010年和2012年分别登上TOP500榜首的“天河一号”和“Titan”都采用了通用计算图形处理器(GPGPU)加速的体系架构。在这次的榜单上有62套系统采用了这种混合架构加速的体系架构,比上一届的榜单多出了4套。
采用协处理加速的体系架构在高性能计算领域很早就已出现,只是当天河一号采用这种架构一举夺得榜首位置后,引起了更多人的注意。圣地亚哥超算中心副主任Richard Moore在2012高性能计算专家委员会中国研讨会上表示,天河一号的成功的确让包括美国在内的众多高性能计算专业人士眼前一亮,未来会有越来越多带有加速器的高性能计算系统出现。不过他认为,要想把各种混合架构的系统用好,最关键的是在软件编程方面下更多的功夫,提高不同应用在混合架构上的效率。“而至强融核由于可以采用与传统通用处理器同样的编程工具,和其他的异构系统相比,在编程效率上有很大的提高。圣地亚哥超算中心的相关人员也在通过TACC的系统,对至强融核进行相应的研究工作。”
正如Richard所说,至强融核最吸引人之处,就是它能够充分利用为英特尔架构提供的、已被用户熟知的编程语言、并行模式、技术和开发人员工具,这有助于确保软件公司和企业的IT部门加大对并行代码的利用,且无需为与加速器相关的、针对硬件的特定编程模式重新培训其开发人员。
英特尔目前已经发布了Parallel Studio XE和 Cluster Studio XE等软件工具,来帮助科学家和工程师们优化其代码,以便充分利用至强融核。这些工具能够通过至强融核和至强E5处理器共用的编程语言和模型对代码进行优化,从而使应用不但能从至强融核的数十个内核中获益,亦可从至强E5处理器更为高效的多线程资源利用上获得帮助。
目标不止HPC
最近一年半以来,英特尔已经在全球挑选了近百家合作伙伴来对至强融核进行相应的测试。其中在中国就包括中石油南京物探院、BGP东方物探、中科院计算技术研究所、中科院过程研究所等在内的多家高性能计算典型用户。
英特尔公司副总裁兼数据中心及互联系统事业部总经理柏安娜表示:“英特尔至强融核协处理器是英特尔公司创新史上的一大成就,它将推动我们在研究和探索领域再创新高,并重申了我们在实现百亿亿级计算方面的承诺。英特尔至强处理器产品家族和英特尔至强融核协处理器的强强联合可提供无与伦比的性能、效率和可编程性,从而将改变高度并行化应用所能达到的范围和规模。利用该技术作为高性能计算的全新基石,将使诸如提前 21 天精确预测气候模式,以及找到治愈疾病的新方法等现实世界挑战的破解变得更具可能性。”
如果追溯至强融核的发展路径,可以很清楚地看到英特尔在MIC技术方面的发展路径。可以感到,英特尔对于MIC的应用并不局限在高性能计算一方面。2011年7月,英特尔就曾经在无锡正式宣布在中国引入众核研究社区(MRAC),该社区的目标就是与中国研究者一起共同探讨众核并行编程领域所面临的关键性问题和研究方向。而至强融核所具有的独立IP地址、支持Linux操作系统等特性,让人对其应用范围有了更多的遐想。
据悉,除了两款用户定制化的型号外,英特尔会向市场推出3100和5110P两款至强融核产品。3100将能够提供超过1000 Gigaflops(即每秒1万亿次浮点计算)的双精度浮点计算性能,并支持容量最高达6GB、带宽最高达240GB/秒的内存,以及内存错误校正码(ECC)等一系列可靠性特性,功耗(TDP)范围在 300瓦以内。5110能够实现1011 Gigaflops(即每秒1.01万亿次浮点计算)的双精度浮点计算性能。,支持容量和带宽分别高达8GB和320GB/秒的GDDR5内存,功耗(TDP)为225瓦。
之前在英特尔与中科院计算所成立联合实验室的揭幕典礼上,中科院计算所所长孙凝晖表示,“至强融核只有不局限在高性能计算领域,才会有更强的生命力。”据悉,双方的合作就是针对 MIC平台的编程与优化、应用程序调优以及开发数据中心评估基准方面的研究。孙凝晖还专门强调,希望将至强与至强融核混合架构方面的研究成果用于深入探索高效的数据中心服务器体系结构,开发相应的硬件和软件系统。
链接
走近Stampede
位于榜单第七位的超级计算机“Stampede”是新上榜的系统,安装在美国德州先进计算中心(TACC)。这台大家伙由6200台服务器组成,采用了英特尔至强E5-2680和至强融核协处理器(Xeon Phi),计算速度达到2.66Pflops(千万亿次浮点计算每秒)。TACC在高性能计算领域,主要针对千万亿次的代码优化、计算流体动力学研究、下一代网格的测试、生物信息学的并行算法等方面展开了研究。
在最新TOP500排行榜上,有379套上榜系统采用了英特尔处理器,榜单中还新增了 7套基于英特尔至强融核协处理器的上榜系统,其中包括排名第七位的Stampede系统,其计算速度达到了2.66PFlops(千万亿次浮点计算每秒)。至强融核协处理器基于英特尔集成众核(MIC) 架构,在高度并行化的应用方面能够提供出色的性能。在英特尔公布的一份资料中,中石油南京物探院总工程师赵改善介绍,该院的叠前深度偏移应用在至强融核上的性能提升了2.53倍。
挑战GPGPU
在2010年和2012年分别登上TOP500榜首的“天河一号”和“Titan”都采用了通用计算图形处理器(GPGPU)加速的体系架构。在这次的榜单上有62套系统采用了这种混合架构加速的体系架构,比上一届的榜单多出了4套。
采用协处理加速的体系架构在高性能计算领域很早就已出现,只是当天河一号采用这种架构一举夺得榜首位置后,引起了更多人的注意。圣地亚哥超算中心副主任Richard Moore在2012高性能计算专家委员会中国研讨会上表示,天河一号的成功的确让包括美国在内的众多高性能计算专业人士眼前一亮,未来会有越来越多带有加速器的高性能计算系统出现。不过他认为,要想把各种混合架构的系统用好,最关键的是在软件编程方面下更多的功夫,提高不同应用在混合架构上的效率。“而至强融核由于可以采用与传统通用处理器同样的编程工具,和其他的异构系统相比,在编程效率上有很大的提高。圣地亚哥超算中心的相关人员也在通过TACC的系统,对至强融核进行相应的研究工作。”
正如Richard所说,至强融核最吸引人之处,就是它能够充分利用为英特尔架构提供的、已被用户熟知的编程语言、并行模式、技术和开发人员工具,这有助于确保软件公司和企业的IT部门加大对并行代码的利用,且无需为与加速器相关的、针对硬件的特定编程模式重新培训其开发人员。
英特尔目前已经发布了Parallel Studio XE和 Cluster Studio XE等软件工具,来帮助科学家和工程师们优化其代码,以便充分利用至强融核。这些工具能够通过至强融核和至强E5处理器共用的编程语言和模型对代码进行优化,从而使应用不但能从至强融核的数十个内核中获益,亦可从至强E5处理器更为高效的多线程资源利用上获得帮助。
目标不止HPC
最近一年半以来,英特尔已经在全球挑选了近百家合作伙伴来对至强融核进行相应的测试。其中在中国就包括中石油南京物探院、BGP东方物探、中科院计算技术研究所、中科院过程研究所等在内的多家高性能计算典型用户。
英特尔公司副总裁兼数据中心及互联系统事业部总经理柏安娜表示:“英特尔至强融核协处理器是英特尔公司创新史上的一大成就,它将推动我们在研究和探索领域再创新高,并重申了我们在实现百亿亿级计算方面的承诺。英特尔至强处理器产品家族和英特尔至强融核协处理器的强强联合可提供无与伦比的性能、效率和可编程性,从而将改变高度并行化应用所能达到的范围和规模。利用该技术作为高性能计算的全新基石,将使诸如提前 21 天精确预测气候模式,以及找到治愈疾病的新方法等现实世界挑战的破解变得更具可能性。”
如果追溯至强融核的发展路径,可以很清楚地看到英特尔在MIC技术方面的发展路径。可以感到,英特尔对于MIC的应用并不局限在高性能计算一方面。2011年7月,英特尔就曾经在无锡正式宣布在中国引入众核研究社区(MRAC),该社区的目标就是与中国研究者一起共同探讨众核并行编程领域所面临的关键性问题和研究方向。而至强融核所具有的独立IP地址、支持Linux操作系统等特性,让人对其应用范围有了更多的遐想。
据悉,除了两款用户定制化的型号外,英特尔会向市场推出3100和5110P两款至强融核产品。3100将能够提供超过1000 Gigaflops(即每秒1万亿次浮点计算)的双精度浮点计算性能,并支持容量最高达6GB、带宽最高达240GB/秒的内存,以及内存错误校正码(ECC)等一系列可靠性特性,功耗(TDP)范围在 300瓦以内。5110能够实现1011 Gigaflops(即每秒1.01万亿次浮点计算)的双精度浮点计算性能。,支持容量和带宽分别高达8GB和320GB/秒的GDDR5内存,功耗(TDP)为225瓦。
之前在英特尔与中科院计算所成立联合实验室的揭幕典礼上,中科院计算所所长孙凝晖表示,“至强融核只有不局限在高性能计算领域,才会有更强的生命力。”据悉,双方的合作就是针对 MIC平台的编程与优化、应用程序调优以及开发数据中心评估基准方面的研究。孙凝晖还专门强调,希望将至强与至强融核混合架构方面的研究成果用于深入探索高效的数据中心服务器体系结构,开发相应的硬件和软件系统。
链接
走近Stampede
位于榜单第七位的超级计算机“Stampede”是新上榜的系统,安装在美国德州先进计算中心(TACC)。这台大家伙由6200台服务器组成,采用了英特尔至强E5-2680和至强融核协处理器(Xeon Phi),计算速度达到2.66Pflops(千万亿次浮点计算每秒)。TACC在高性能计算领域,主要针对千万亿次的代码优化、计算流体动力学研究、下一代网格的测试、生物信息学的并行算法等方面展开了研究。