第三代AMD EPYC处理器深度解析及独家测试

来源 :微型计算机 | 被引量 : 0次 | 上传用户:hmxj1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  AMD EPYC 7003系列处理器技术架构解析
  在AMD Zen 3消费级处理器产品大获成功之后,AMD的眼光又转向了企业级、云计算以及HPC市场。这一次,AMD带来了全新的AMD EPYC(霄龙)7003系列处理器,最高64核心128线程、最多超过竞争对手117%的性能以及主打高频的“F”系列产品,都让霄龙7003系列处理器充满着强悍的竞争力,值得我们细细品味。
  AMD的EPYC系列处理器是在2017年6月20日正式发布的。经过4年多的发展,EPYC系列处理器成为目前企业级、超算以及加速计算市场上最重要也是最值得选择的处理器产品之一。EPYC系列处理器经历了多代发展,从代号“那不勒斯”的第一代EPYC 7000系列处理器开始,到2019年8月问世,代号“罗马”的第二代EPYC 7002系列處理器,再到本次发布的Zen 3架构、代号“米兰”的第三代EPYC 7003系列处理器,AMD通过先进的工艺制程、创新的内核设计、独特的Chiplet方案以及更为市场化的型号设置,在服务器市场份额不断攀升。
  在AMD EPYC 7003系列处理器上,AMD宣称自己在产品设计上将继续根据路线图实现性能提升、提供具有竞争力的性能、更强安全性的产品以及通过计算加速带来的价值提升三个方面持续努力。AMD给出的有关EPYC 7003系列处理器的总体性能评价包含了三个方面,也就是相比上代产品最高两倍的企业级性能提升(基于SPECjbb2015测试)、最高两倍的云计算性能提升(基于SPECrate?2017_int_base测试)、最高两倍的HPC性能提升(基于SPECrate?2017_int_base测试)。因此,本次EPYC 7003系列产品的确值得期待。
  EPYC全面进化:AMD Zen 3架构入驻
  对AMD这样横跨多个领域的厂商来说,一款处理器核心架构的设计,基本上决定了未来数年产品发展方向。从Zen开始,AMD的核心架构设计开始突飞猛进,不断改进和拓展,充分挖掘着架构的潜力。现在,AMD全新的Zen 3架构已经被用于桌面锐龙系列处理器和移动锐龙系列处理器产品,AMD的四大产品线中,只有面向HEDT平台的线程撕裂者和面向商用的EPYC系列尚未更新。在EPYC 7003系列处理器上,Zen 3终于来了。
  Zen 3架构:19%的IPC性能提升
  有关AMD在Zen 3架构设计上的变更和一些细节内容,本刊已经介绍了多次。简单来说,对于商业用户,AMD的Zen 3架构主要有四大改进,它们是增强的分支预测能力、更强的整数吞吐能力,双倍INT8单元和更强的浮点能力、大幅度降低的内存延迟等。通过架构设计的改进,AMD在Zen 3上实现了19%的IPC提升,大幅度提高了处理器单核心执行能力。更加具体来看的话:
  1.Zen 3架构采用了SMT设计,每个核心拥有2个线程。
  2.Zen 3架构应用了最先进的分支预测设计,能够有效避免分支预测错误和空泡等问题。
  3.在缓存方面,Zen 3的一级指令缓存和一级数据缓存都采用了8路设计,容量为32KB,Op缓存部分支持4K个指令排序,二级缓存采用了数据和指令混合的方案,8路,容量为512KB。
  4.前端指令解码方面,Zen 3每周期可以执行4个指令解码(依旧是4发射设计)或者从Op缓存中提取8个指令,对整数或者浮点数据而言,每周期可以分派6个宏指令或者微指令,这里Zen3依旧采用了协处理器执行模型,且可以分别同时执行整数和浮点计算。
  5.Zen 3的执行部分也经过了加强,现在Zen 3的整数执行单元有4个整数ALU单元、1个带分支预测的ALU单元、3个AGU单元和1个专用分支预测单元。由于有3个AGU单元,在地址计算方面,Zen 3每周期可以进行3个地址计算。浮点计算部分是Zen3加强的重点之一,Zen 3现在拥有6个浮点计算单元,每周期可以执行2个256bit的FP乘积累加运算单元(FMAC)。
  6.内存单元部分,Zen 3的内存单元现在每周期可以执行3个数据加载,或者执行1个数据加载和2个数据存储,这样的混合模式也提高了数据存储效率。
  另外,AMD还给出了Zen 3架构和之前Zen 2架构的对比。相比AMD的Zen 2架构,AMD的Zen 3在前端、执行、读取和存储三大部分最重要的改进为:
  前端部分的改进包括:
  ●两倍容量的L1 BTB,现在容量是1024单位
  ●提高了分支预测单元的带宽
  ●分支预测单元的“无空泡”模式
  ●可以从错误预测中更快速地恢复
  ●Op缓存更快的排序速度
  ●更细粒度的Op缓存管道切换执行部分:
  ●整数部分拥有专用的分支预测和地址选择器
  ●整数部分拥有更大的执行窗口(增加了32个单位)
  ●降低了整数和浮点指令通过Ops选择的延迟
  ●浮点计算部分现在变化为6个单元
  ●浮点部分MAC计算降低了1个周期读取和存储单元:
  ●更高的读取和存储带宽(分别增加了1个单位)
  ●更为灵活的加载和存储操作
  ●改进的内存依赖性检测
  ●TLB部分的walker表从2个增加至6个
  安全特性:全面加强
  除了上述内容外,AMD在Zen 3的指令集方面也做出了一些增强,带来了包括INVLPGB、AVX2-VAES/VPCLMULQDQ、SEV- ES Enhancements、Secure Nested Paging、CETShadow Stack、Memory Protection Keys for Users等新的指令集,面向的功能包括内核功能、浮点计算(AVX2,主要面向浮点计算、加密解密等功能)和安全功能等。   在安全功能方面,AMD特别提到,新的EPYC系列处理器和Zen 3架构大幅加强了这方面的功能,包括专门设计的增强的SEV- ES功能,主要是限制中断的注入,限制恶意管理程序注入SEV- ES访客中断/异常类型,另外还能够将调试寄存器添加到交换状态中,这类功能能够很好地避免之前类似“熔断”“幽灵”那样的攻击手段生效。此外,AMD还加入了SNP安全嵌套分页,主要基于虚拟机内存、虚拟机寄存器的加密保密功能,进一步增加系统完整性保护,防止恶意程序的攻击,而新的CET ShadowStack功能则可以防止ROP攻击等。
  AMD总结了从之前第一代EPYC处理器到现在第三代EPYC处理器,AMD在安全特性方面的努力。比如面对“熔断”“幽灵”这样的攻击,第一代EPYC系列处理器只能使用固件或者SO/VMM等方式进行防御,也就是基本上都在软件层面上控制,虽然已经领先竞品很多,但相对而言安全性并不高且有性能损失。从第二代EPYC系列处理器开始到现在全新的第三代EPYC系列处理器,AMD在硬件层面做出了独特设计,现在可以实现硬件和OS/VMM层面的双重防御,其安全性能更好并且性能损失更低。总的来说,在Zen 3架构引入之后,AMD全新EPYC 7003处理器无论是性能还是安全特性,都得到了显著的进步。尤其是针对商用的安全特性方面,AMD还做出了针对性的增强,这一点在后文中还有更为详细的解释。
  AMD EPYC 7003系列处理器的SoC设计一览
  除了CPU架构之外,AMD在处理器SoC层级的设计上也颇有独到之处。EPYC 7003是一款面向企业级用户、HPC和云计算的处理器,它的设计又有哪些特点呢?
  SoC宏观结构:Chiplet 9芯片设计
  先來看看EPYC 7003系列的全新特性。EPYC 7003系列在SoC层级上除了之前详细介绍的Zen 3架构外,还带来了增强的存储性能,AMD特别指出EPYC 7003系列处理器拥有目前x86处理器中最大的L3容量,平均每个核心最多可以分配到最多32MB。内存方面支持4通道、6通道和8通道内存交织,其中6通道内存配置模式是新增的。
  在可升级性方面,EPYC 7003系列处理器和之前的EPYC7002系列处理器采用了同样的插槽方案,用户只需要更新主板的BIOS,就可以无缝升级至全新的产品,这进一步降低了厂商的采购、使用成本。最后,EPYC 7003系列产品安全特性得到了进一步加强(不仅仅是Zen 3架构)。
  AMD展示了EPYC 7003系列处理器SoC层面的宏观架构图。本次EPYC 7003系列处理器依旧采用了Chiplet设计,1个IO芯片 8个计算芯片,整个处理器内部的布局依旧是IO核心位于中央,四周分别布置了总计8个CCD计算芯片,总计9颗芯片来组成整个EPYC 7003系列产品的SoC。
  全新的Zen 3 CCD架构:最多每核心32MBL3缓存
  继续深入的话,EPYC 7003的CCD应该和桌面锐龙处理器的CCD基本相同,那就是1个CCD内部包含了8颗Zen 3架构的CPU核心,每个CPU核心拥有自己的L2缓存以及共享的32MBL3缓存。这部分核心采用了台积电的7nm工艺制造。在Zen 3架构的锐龙处理器上,AMD使用的7nm工艺经过了升级,因此在频率、功耗方面表现都更为出色。在EPYC 7003系列产品上,AMD表示仍然采用了改进的7nm工艺。
  在CCD方面,AMD之前提及新的EPYC 7003系列处理器最高可以为单个核心配置32MB L3缓存。能实现如此大容量的L3缓存配置,一方面是由于Zen 3架构的原因。Zen 3架构在SoC层面将Zen 2架构的两个CCX合二为一成为一个CCD,所有8个核心共享32MB L3缓存,这一部分内容在本刊之前对锐龙5000系列处理器的介绍中有详细的解释。在这里需要额外强调的是Zen2和Zen 3在缓存使用机制上的一点差异。在Zen 2上,4个核心共享16MB缓存,其中8MB缓存被用作存放所有核心都使用的共享数据,其余的8MB缓存则分配给4个核心使用,平均每个核心使用2MB。
  在Zen 3上,8个核心共享32MB缓存,其中依旧是8MB用于所有核心存放共享数据,剩余的24MB则可供每个核心使用,单核理论上最高可达24MB,所有核心平均分配的话每个核心可以得到3MB L3缓存。相比Zen 2的设计,Zen 3的方案由于核心可使用的缓存数量的提升,因此带来了命中率的提高。比如在一些指令密集型应用中,这类应用占用缓存不多,但是需要更多的核心操作,因此可能只需要8MB共享缓存就能满足需求,其余的24MB缓存就可以被其他操作占用。因此,AMD通过改良核心设计带来了缓存命中率的提高,反映在大量的应用程序中就是效率、性能的提升。接下来,EPYC 7003系列处理器最高可以为单个核心配置32MB L3缓存的另一方面原因则得益于自身的设计。AMD以EPYC 75F3处理器为例,这款处理器有32个核心,但是依旧采用了9个芯片的方案,也就是说,EPYC 75F3依旧保留了所有的CCD和32MB缓存。因此最终对每个CCD来说,其所拥有的4个核心将可以使用32MB缓存,在理论上能进一步提高缓存敏感型应用的性能。
  在最极端的情况下,比如8核心的EPYC 72F3处理器,也可以采用这种方式实现,实际上就是每个CCD保留了1个核心,可使用完整的32MB缓存。虽然这种方式所耗费的成本大,但是1个Zen 3核心得到了32MB L3缓存,很大程度上可以将缓存敏感型应用的性能提升至本代架构设计下的极限值,单线程性能也会得到一定程度的提升,同时还保留了8通道内存、128通道PCIe 4.0等技术规格,让这款产品在顶级商用市场找到自己的用武之地。
  IO核心的特性:内存支持情况   AMD还特别提到了IO核心对内存控制器的改进。目前IO核心的内存控制器支持最高8通道DDR4 3200 ECC内存,支持内存的类型包括RDIMM、LRDIMM、3DS、NVDIMM- N。内存容量方面,以每2个DIMM实现1个通道计算的话,一个处理器插座可以支持最大4TB内存,也就是说1个DIMM支持最多256GB内存。
  为了进一步说明AMD在内存控制器上的设计,AMD还专门用一张PPT来说明有关内存交织的配置模式。AMD将处理器内存的通道以A、B、C、D、E、F、G、H八个英文字母进行命名,如果只是使用4个通道的话,那么需要启用的是C、D、H、G的DIMM1,一共组成4个通道。如果是8通道的话,可以启用所有八个通道的DIMM1即可,相关的DIMM0处于空闲状态也不会影响多通道的运营。另外,AMD本次特别加入了6通道设计,这是在前代4通道和8通道之间插入的一种新的模式,可以获得相对4通道和8通道更好的平衡性能和成本。6通道方案中,F和B通道不需要插入内存,其余的通道只需要在DIMM1插入内存即可实现。
  对于EPYC 7003系列处理器的内存支持情况,AMD认为如果用户使用AMD推荐的内存通道方案的话,有助于避免内存通道中出现过热的点,也就是说之前的方案可能存在部分内存通道被系统反复调用,从而出现内存通道负载过重、影响性能的情况。新的方案则可以更好地平衡工作负载,并且可以降低配置内存的成本以及所需内存数量。
  IO核心的特性:安全控制
  除了8个CCD外,EPYC 7003系列处理器中最大的一颗芯片就是IO核心了。IO核心内部包含了AMD安全处理器(AMDSecure Processor)、最多8通道的DDR4内存控制器、安全控制中心以及PCIe控制器。在PCIe控制器方面,EPYC 7003的PCIe控制器可以兼容PCIe 3.0和PCIe 4.0,最多擁有128条PCIe通道,不过这些通道也可以被分配用作SATA或者其他内部互联,因此一个IO核心最多可以支持32个SATA或者NVMe设备,另外还有162个可配置通道。同时IO核心内部还拥有服务器的互联控制中心,提供了包括USB、UART、SPI、LPC、I2C等模块,并对外提供互联功能。
  下面具体来介绍一下安全处理器。安全处理器是一个32bit的微控制器,可以独立运行相关的安全操作系统和核心功能。其具体功能包括专用的安全子系统、安全启动、硬件可信启动、SME(Secure Memory Encryption,安全存储加密)、SEV- ES、SNP等功能。其中SEV- ES和SNP在本文之前也已经介绍过。但是,AMD在这里特别提到有关硬件验证启动技术,首先AMD的安全处理器会加载片上ROM的只读内存,读取硬件信任根文件,这是一个在芯片上固定位置的验证文件。然后在操作系统内核开始读取BIOS代码之前会根据信任根文件的内容对BIOS进行验证,在BIOS通过安全认证之后,系统才会加载包括操作系统、虚拟机等应用。
  在数据安全方面,AMD还提供了密钥管理来实现数据端到端的加密,比如从ROM到DIMM,密钥管理的相关功能都可以对其进行数据加密。这个功能有多个模式,一个是SME安全内存加密,这个模式下只要系统重置就会生成一个单一随机密钥对数据进行加密;另一个模式是内存加密虚拟化SEV模式,也包括之前提到的SNP功能,SEV模式可以针对虚拟机提供单独的密钥,也可以针对每一个访客的登录进程来给出单独的密钥,并交由安全处理器来使用和控制。AMD宣称,在这种模式下可用的密钥数量为509个,和前代产品相同。上述两个功能配合SNP、SEV以及SEV-SE,就能完成虚拟机有关安全登录的控制和管理。
  从AMD在安全方面的功能情况来看,实际上相当于AMD在IO核心上内置了一个专用的安全处理器和专用的操作系统,通过只读、隔离控制的方式将安全核心的操作和外部操作系统、虚拟机进行分离,并在内核层面生成密钥进行安全处理,这样就形成了一个高于现有操作系统或者应用层面的独特的安全层。所有的操作和控制包括BIOS这样传统意义上,人们看起来比较基础的层级,都需要先通过安全处理器和相关安全功能的验证后才能正常运转,这不但使得数据更为安全,还带来了整个系统更为坚强的抗攻击能力,配合CPU的新指令集、各种安全功能等,大幅提高了处理器的安全特性。
  这一部分的最后再来看看IO核心的工艺情况。之前AMD在锐龙5000系列处理器上,IO核心采用了格罗方德的12nm工艺,因此,在新的EPYC 7003系列处理器上,AMD也可能采用同样的做法,那就是IO核心依旧使用的是格罗方德的12nm工艺。实际上,对EPYC处理器来说,IO核心的面积由于集成了内存控制器、缓存、PCIe控制器以及和所有核心连接的Infinity Fabric、各种功能单元接口等,因此内部结构不但非常复杂并且晶体管数量也不小。实际上在格罗方德的12nm工艺下,IO核心的面积非常大。目前尚未有具体的IO核心面积数据,但是目测来看,基本相当于4~6个CCD核心。可能AMD会在未来进一步升级IO核心的工艺。
  AMD EPYC 7003系列处理器:型号和性能
  在了解了有关EPYC 7003系列处理器在核心架构和SoC设计方面的内容后,接下来我们来看看EPYC 7003系列处理器型号方面的内容。说实话,对EPYC这种面向企业级、商业用户的处理器而言,在型号方面很可能是非常复杂和难以区分的。不过AMD在型号梳理归纳方面显然还是下了一番功夫,从核心数量和用途两个方面进行了归纳,让大部分用户一眼就知道自己需要什么、应该选择什么。首先来看所有处理器都支持的技术特性。目前所有EPYC 7003系列处理都支持8通道DDR4 3200、最大4TB内存、128通道PCIe 4.0、SMT技术、支持Turbo 频率加速、支持18Gbps的AMD Infinity Fabric总线、支持SME和SEV安全特性、支持IF总线和内存时钟同步等技术。在支持所有技术特性的基础上,AMD将处理器核心数量分为7个档次,分别是64核心、56和48核心、32核心、28核心、24核心、16核心以及8核心进行排列,总计19款(部分产品分为后缀“P”的单路产品,因此表中只有15个)。   由于AMD给出了所有处理器的详细列表,因此本文就不再赘述,只是选一些有特点的产品多说几句。根据频率、性能和功耗来排列的话,综合性能最强的应该是64核心的EPYC 7763,TDP 280W,默认频率2.45GHz、Boost频率3.5GHz。64核心中另外一款EPYC 7713P的基准频率相比EPYC 7763低了一些,但是Boost频率又达到了3.675GHz,不过功耗降低至225W。从AMD的命名规则可以看出,后缀带有“P”的处理器是单路产品,特性以相对较低的功耗和高性能为主,与此类似的还有EPYC 7543P、EPYC 7443P以及EPYC 7313P。值得一提的是EPYC 7313P,在支持上述所有规格的情况下,这款处理器的TDP功耗仅为155W,和目前16核心的桌面处理器基本相当,非常适合对功耗和散热有要求的企业或者商用场合使用。
  另外,在32核心、24核心、16核心和8核心的家族中各出现了一款带有F的产品,分别是EPYC 75F3、EPYC 74F3、EPYC73F3和EPYC 72F3。在这里,F的意思是“Frequency,频率”的意思,是高频系列,这意味着这些处理器将拥有更高的单核心Boost频率。目前来看这类产品的工作频率普遍在4GHz以上,其中EPYC 72F3的最高Boost频率达到了4.1GHz。这样一来,AMD的另一种分类方式也就非常明确了。AMD将处理器以单核心性能优先、核心数量优先、均衡或综合性能来分成了三大类。
  其中,单核心性能优先的四款产品全部都是带“F”型号的产品,也就是前文提到的EPYC 75F3、EPYC 74F3、EPYC 73F3和EPYC 72F3,最多32核心、最少8核心。其中8核心产品单核心拥有32MB L3缓存,这也是AMD一开始就提到的L3缓存最大的处理器产品。这类产品最适合技术类运算、关系型数据库以及商用计算。对多核心、多线程性能优先的用户来说,选择64核心到48核心的处理器比较合适,AMD在这里推荐了EPYC 7763、EPYC 7713、EPYC 7713P、EPYC 7663以及EPYC 7643五款产品。这类产品针对的市场是企业应用,高性能计算和云计算。
  对均衡或者综合性能优先的用户来说,AMD推荐用户选择16核心~32核心的10款产品,其中32核心的产品有3款,分别是EPYC 7543、EPYC 7543P和EPYC 7513;28和24核心的产品有四款,分别是28核心的EPYC 7453和24核心的EPYC 7443、EPYC 7443P以及EPYC 7413;最后则是16核心的产品,包括EPYC 7343、EPYC 7313、EPYC 7343 1P型号。这类产品主要针对的是对成本比较敏感,但又需要高性能的企业级用户。
  从AMD的产品设定和分类推荐来看,AMD还是将主流市场集中在16~32核心这个区间,19款产品中,有10款产品都在这个区间。对大家都颇为看好的64核心产品来说,AMD只给出了3款型号,一方面可能考虑其高昂的价格和搭配成本,另一方面是整个市场对高端64核心处理器的需求相对有限。另外,AMD在本代延续了上代“F”系列产品的设定,对注重单线程性能的用户来说,也是颇为不错的选择。
  有关处理器的性能部分,AMD也给出了大量的内容。在总体性能部分,AMD给出了全系列EPYC 7003处理器和上代EPYC7002处理器以及英特尔至强金牌6258R 28核心处理器、英特尔至强银牌 4216 16核心处理器的性能对比。从AMD的数据来看,AMD之前的第二代EPYC 7002系列产品中的部分处理器在性能上已经超出英特尔相对应的产品不少了,全新的EPYC 7003系列处理器更是以全面超出的态势存在,无论是单线程性能还是多线程等,都显著领先竞争对手不少。另外,AMD还选用旗下64核心的EPYC 7763对比了28核心的英特尔至强金牌6258R,在SPECRATE?2017_FP_BASE的浮点计算测试中,前者领先后者幅度高达106%。在相应的整数计算测试SPECRATE?2017_INT_BASE中,前者也领先后者106%。在多线程的JAVA虚拟机测试SPECJBB@2015中,64核心的EPYC 7763领先28核心的英特尔至强白金8280高达117%,各种领先幅度都令人咋舌。要知道,实际上第二代EPYC 7002系列处理器就能够以大约80%的领先幅度碾压英特尔对应产品了,全新的EPYC 7003只是进一步扩大了性能领先的幅度而已。
  如果说6 4核心的EPYC对比28核心的英特尔至强有点“胜之不武”的话,那么32核心的EPYC 75F3在浮点计算测试SPECRATE?2017_FP_BASE以70%的幅度领先了28核心的英特尔至强金牌6258R,依旧显示出极为强悍的实力。
  此外,AMD还给出了与服务器组建相关的对比。在同样配置整数性能为25000单位的服务器设备的话,采用英特尔至强金牌6258R处理器,需要63个机架,占据的是4个机柜位置。但是换用32核心的EPYC 7763处理器的话,只需要32个机架和3个机柜就可以满足需求了,这带来了49%的机架节省、25%的空间节省、35%的电能节约和35%的TCO(4年期的总体拥有成本)的节约。这对企业用户来说是非常划算且拥有极高吸引力的。
  市场上暂无对手
  从本文的介绍可以看出,AMD全新的EPYC 7003系列处理器产品的主要特点包括采用了全新的Zen 3架构,加强了安全特性,优化了Chiplet布局,还根据市场和应用情况推出了面向不同客户、不同场景的处理器版本,尤其是“F”系列产品更是独树一帜。在性能方面,考虑到AMD目前独特的架构以及Chiplet设计和制程领先的优势,其实对于性能这一点,用户已经无须擔心了。毫不夸张地说,采用64核心设计的AMD第三代EPYC代表了目前业内x86高性能服务器非常突出的水平和性能,其余的56核心、48核心、32核心以及28核心、24核心、16核心、8核心等产品也都各有用处,百花齐放。AMD展示的合作伙伴阵营,也预示着新处理器即将迎来的市场热潮。   现在,AMD在企业级处理器的产品端已经准备好了,EPYC系列处理器的“三步走”战略发展到今天已经非常成熟了。据AMD宣布,预计到2021年年底,AMD EPYC处理器生态系统将实现大幅增长,届时预计将有超过400个基于历代EPYC处理器产品的云计算实例,以及超过100个基于第三代EPYC处理器的新服务器平台。仅就现在的产品来看,AMD全新的EPYC 7003系列处理器的确不错,领先优势显著,在市场上暂无对手。对于需要高性能应用的企业级用户而言,是非常值得考虑的选择。
  第三代AMD EPYC(霄龙)处理器独家测试
  通过第三代AMD EPYC处理器的详细技术解析,我们可以看出全新的Zen 3架构让第三代AMD EPYC处理器的浮点性能、分支预测能力、安全性等方面均有了非常明显地提升。通过架构设计的改进,AMD宣称第三代AMD EPYC处理器的IPC在上一代产品的基础上提升高达19%。那么第三代AMD EPYC处理器在实际应用中的性能究竟提升了多少呢?在AMD的大力支持下,我们特别针对第三代AMD EPYC处理器进行了独家测试。
  参测处理器规格解析
  MC本次测试的对象是AMD EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器,下面我们首先来看看它们的规格参数。EPYC 7763是第三代AMD EPYC处理器中综合性能最强的一款产品,它采用64核128线程设计,基准频率为2.45GHz,Boost频率最高可达3.5GHz,TDP为280W。EPYC 7713同样采用64核128线程设计,其频率设定是2.0GHz~3.675GHz,相比EPYC 7763,前者的基础频率稍低,但后者的Boost加速频率要更高一些。
  此外,EPYC 7713的TDP为225W,比EPYC 7763更低一些,所以前者更适合应用在需要更强单核计算性能和更低功耗的场景。第三代AMD EPYC处理器中包含4款命名带有“F”的产品,采用这种命名方式的主要目的是突出它们拥有更高的单核心Boost频率,而在这4款产品中,EPYC 75F3的综合性能最强。它采用32核64线程设计,基础频率为2.95GHz,Boost频率高达4.0GHz,TDP则为280W,它更适合应用在一些对处理器频率要求较高的场景中。
  当然,以上3款处理器均由经过升级的台积电7nm工艺打造,并基于AMD最新推出的Zen 3架构,它们均拥有容量高达256MB的三级缓存,同时最高支持8通道DDR4 3200内存,内存带宽(每路)高达204.8GB/s。
  性能测试
  下面我们来了解一下测试平台。本次测试统一考察的是双路系统的性能,并且统一使用的是AMD DAYTONA _X主板,搭配DDR4 3200内存(32GB×16)。为了让大家对第三代AMDEPYC处理器的性能有更加直观的认识,MC还会将EPYC7763、EPYC 7713、EPYC 75F3这3款处理器的测试成绩与第二代AMD EPYC处理器的旗舰级产品EPYC 7742进行对比。需要说明的是,由于C- Ray 1.1和Sysbench的测试方法更新,EPYC 7742的测试成绩不再具备对比性,所以在这两项测试中,我们将重点考察EPYC 7763、EPYC 7713、EPYC 75F3这3款处理器的性能表现。
  SPECrate 2017测试的是在单位时间内运行的实例数量,这是服务器采购时的主要性能指标,所以服务器厂商和处理器厂商通常提供的是这一测试成绩。在SPECrate 2017中包含SPECrate Integer和SPECrate Floating Point,前者测试的是整型并发性能,后者测试的是浮点并发性能。
  测试成绩显示,相比双路EPYC 7742,双路EPYC 7763在SPECrate 2017中的性能提升非常明显。例如在SPECrate2017_int_base中,双路EPYC 7763的得分为777分,而双路EPYC 7742在该项测试中的测试成绩则为682分,前者的性能提升约14%。而在考察处理器浮点运算性能的SPECrate 2017_fp_base中,双路EPYC 7763的测试成绩为610分,以17%的性能优势大幅领先双路EPYC 7742。值得一提的是,SPEC的官网数据显示双路EPYC 7763的SPECrate 2017_fp_base测试成绩达到629分,相比双路EPYC 7742,前者的性能优势进一步扩大到20%。
  EPYC 7713和EPYC 7742的TDP虽然都是225W,但得益于更先进的Zen 3架构和更高的Boost频率,双路EPYC 7713在SPECrate 2017中的表现全面领先双路EPYC 7742。其中,双路EPYC 7713的SPECrate 2017_int_base测试成绩领先双路EPYC 7742约9%,而在SPECrate 2017_fp_base中,双路EPYC 7713的性能优势更是达到14%。正如前文所述,EPYC75F3是一款采用32核6 4线程的处理器,它却在SPECrate2017中带来了亮眼的表现。首先,在SPECrate 2017_int_base中,双路EPYC 75F3的得分为556分,相比上一代旗舰级产品EPYC 7742组成的双路系统,前者仅落后约23%。更加喜人的是,在SPECrate 2017_fp_base中,双路EPYC 75F3的性能表现已经达到双路EPYC 7742的水准。
  综合SPECrate 2017的测试成绩我们不难发现,第三代AMD EPYC處理器在浮点运算方面的性能提升非常喜人,这自然要归功于Zen 3架构在浮点计算部分的加强。同时,得益于更大的执行窗口,以及专用分支预测和地址选择器的加持,第三代AMD EPYC处理器在整数运算上的性能也得到增强,这一点也在SPECrate 2017的测试成绩中得到充分体现。   Stream-Traid
  Stream是业界广为流行的综合性内存带宽实际性能测量工具之一。和硬件厂商提供的理论最大内存带宽不同,通过fortran和C两种高级且高效的语言编写完成的Stream,可以在测试中充分发挥出内存的能力。Stream一共包含Copy、Scale、Add和Triad这4种操作,其中Triad组合了前面3种操作,所以其测试成绩更具参考价值。
  对比参测处理器的规格参数我们不难看出,第三代AMDEPYC处理器的每路理论内存带宽和EPYC 7742保持一致。从我们的测试成绩来看,参测的3款第三代AMD EPYC处理器各自组成的双路系统,在这項测试中的实际内存带宽基本保持一致,同时还小幅领先双路EPYC 7742。
  NAMD
  NAMD是一种并行的分子动力学代码,由伊利诺伊大学厄巴纳- 香槟分校贝克曼高级科学与技术研究所的理论和计算生物物理学小组开发,它主要用于大型生物分子系统的高性能模拟。本次测试中,我们主要通过NAMD来考察参测处理器的浮点性能。
  从我们的测试结果可以看到,在核心数和线程数相同的情况下,得益于更高的基础频率,以及浮点性能上的提升,双路EPYC7763在NAMD中以3%左右的优势胜过双路EPYC 7742。此外,测试成绩显示双路EPYC 7713的表现要比双路EPYC 7742稍逊一筹,我们认为这是EPYC 7713的基础频率比EPYC 7742稍低一些所致。
  OpenSSL
  OpenSSL广泛用于保护服务器之间的通信,这是许多服务器堆栈中的重要协议。OpenSSL测试主要包含生成签名和验证签名两部分,我们在本次此时中主要进行了生成签名测试。
  测试成绩显示,双路EPYC 7763在我们的测试中每秒钟可生成27163.2个签名,其签名效率比双路EPYC 7742快2%左右。此外,即使EPYC 75F3的核心数和线程数仅为EPYC 7742的一半,但EPYC 75F3处理器的“高频”特点让它在OpenSSL中表现不俗—双路EPYC 75F3在本次测试中生成签名的效率可以达到双路EPYC 7742的66%左右。
  UnixBench Dhrystone 2和 Whetstone测试
  本项目主要用于测试Unix系统性能,其中包括测试字符串处理的Dhrystone 2 using register variables和测试浮点操作速度和效率的Double- Precision Whetstone这两个测试项目。此外,在这两个测试项目均可选用单线程或多线程进行测试,本次测试我们使用的是多线程。
  第三代AMD EPYC处理器强大的浮点运算性能在这部分测试中得到充分展现。例如在Double- Precision Whetstone这一测试项目中,双路EPYC 7763的测试成绩远超上一代定位旗舰的双路EPYC 7742,领先幅度高达40%,同时双路EPYC7713也在这项测试中领先双路EPYC 7742约3 4%。更令人欣喜的是,双路EPYC 75F3在这部分测试中的性能表现可达双路EPYC 7742的89%。而在Dhrystone 2 using registervariables这一测试项目中,第三代AMD EPYC处理器的表现同样比较亮眼。例如相比双路EPYC 7742,双路EPYC 7763和双路EPYC 7713的测试成绩分别领先约17%和3%,同时双路EPYC 75F3的性能也可以达到双路EPYC 7742的78%左右。
  C- ray 1.1
  C- ray是一种常用的光线追踪基准测试,可以显示多线程工作负载下处理器的差异,时间越短说明系统性能越强。在本次测试中,我们使用了4K和8K这两种分辨率进行测试,从而对比参测系统在不同负载下的性能差异。
  得益于较高的核心频率,双路EPYC 75F3在C- ray中的表现比较亮眼。虽然其核心数和线程数仅为双路EPYC 7763的一半,但得益于较高的核心频率,双路EPYC 75F3在4K分辨率下完成测试任务仅比双路EPYC 7763多耗时约1秒,而且即使在8K分辨率下,双路EPYC 75F3完成测试任务的耗时也只是比双路EPYC 7763多耗时约6秒。
  Sysbench CPU测试
  Sysbench是一款被广泛使用的Linux基准测试,它可以对CPU进行性能测试,在测试中主要是通过CPU进行质数加法运算,本次测试使用的质数极限为10000个。
  我们的测试成绩显示,双路EPYC7763 每秒可完成487771轮运算,而双路EPYC 7713的性能约为双路EPYC7763的92%。值得点赞的是,双路EPYC 75F3每秒也能完成304232轮运算,其性能约为双路EPYC 7763的62%左右。虽然EPYC 75F3的核心数和线程数仅为EPYC 7763的一半,但我们认为更高的基础频率是前者的“加分项”。
  目标:继续强化服务器领域的市占率
  总览本次测试结果我们不难看出,Zen 3架构让第三代AMD EPYC处理器的综合性能得到大幅增强。例如,在保持核心数和线程数相同的情况下,双路EPYC 7763在浮点运算性能相对双路EPYC 7742有了跨越式的提升。同时即使核心数和线程数仅为双路EPYC 7742的一半,但双路EPYC 75F3的浮点性能也可以与之媲美。
  得益于更大的执行窗口,以及专用分支预测和地址选择器的加持,第三代AMD EPYC处理器在整数运算上的性能也得到增强,这一点也在本次测试中得到充分体现。此外,第三代AMDEPYC处理器提升了三级缓存应用和内存配置上的灵活性,以及大幅增强的安全性。不仅如此,第三代AMD EPYC处理器还针对不同客户、不同场景推出了包含“F”系列产品在内的多个细分产品线,共计19款产品,整个产品布局非常完善。
  与此同时,AMD仍然在重点打造其EPYC处理器的生态系统。AMD也宣布,预计到2021年底,AMD EPYC处理器将与包括亚马逊、思科、联想、腾讯云在内的众多合作伙伴携手合作,为其生态系统带来超过400个云实例以及超过100个新OEM平台。因此我们认为,第三代AMD EPYC处理器将帮助企业用户从容应对各种复杂的IT挑战,并成为AMD斩获更多数据中心市场份额的新一代战略性产品。
其他文献
时尚的Y2K设计  汲取Y 2 K 作为设计灵感,realme真我Q3在单调的后盖上为我们带来了金属质感、渐变和字母Logo等元素。在我们拿到的迷幻银配色机身上,realme大胆采用了纹理拼接工艺,左侧区域呈现出高亮的金属质感,并密布着网状纹理;右侧区域采用多层纳米光学镀膜工艺,在不同角度下可以散发出多色渐变的光芒。  机身正面,realme真我Q3配备了6.5英寸挖孔设计LCD屏幕。在色彩方面,
“要想真正品鉴威士忌,时间是不可少的。我每天工作12个小时,朝九晚九,之后我就会来这里喝杯威士忌,抽一支雪茄,算是对自己一天的犒劳。这样的约会差不多从8年前开始,和雪茄一起,算是遇到了自己人生中2个重要的元素。一开始饮用威士忌,连自己都觉得有点装腔作势,到后来是真的无可救药地喜欢上了。”  外表看上去儒雅温和的金培达,骨子里喜欢的却是浓烈和本真。为了搜寻这“浓烈和本真”,金培达跑遍了世界各地,“我
它的生意实在火爆,以至于一直以来它都在努力消除“等位”这个甜蜜的烦恼,当开新店,扩大等位区,提供免费水果,饮品,免费美甲、擦鞋等贴心服务仍不足以挽留顾客遗憾的背影时,它推出了外卖服务HI乐送—外送菜品、厨具、专人服务,甚至郊外野炊。当竞争对手还在店里围着顾客打转时,它开始用车轮将生意做到了客人家门口。    海底捞再也无法忍受因等位过久而白白损失的大量客流。  今年6月,在全国7个城市拥有51家连
在塞哥维亚,吃烤乳猪是一件充满仪式感的事。首先,切烤乳猪并不是用刀,而是盘子。此外,开吃之前还需要祈祷,但不是对上帝。    作为距离首都马德里一小时车程的地方,塞哥维亚几乎是每个来西班牙游客必去的地方,通常是早上来,在中午的时候顶着炎炎烈日在古罗马水渠下照相,然后顺着狭窄的小路一直走进去,到主教堂去看看,就匆匆离开了。这样紧凑的行程,并不能了解塞哥维亚的美好,至少是有缺憾的,如果不多角度、近距离
时候尿床,母亲会做两样东西给我吃,一是炖一锅狗肉,二是蒸几只酿肚。酿肚就是将水发泡好的糯米,灌入猪的膀胱(俗称猪尿包,即小肚子),然后蒸熟切片吃。此法很灵,吃几次竟然不尿床了。  那是我记忆中第一次吃叫做肚子的东西。以后我把这道酿肚菜进行了改良,除糯米外,我还灌入了腊肉粒、鲜豌豆、胡萝卜及少许花椒末,蒸出来压紧切片,像一朵朵盛开的鲜花,腊香扑鼻。  其实最好吃的还不是这种小肚子,而是猪的胃那种大肚
布什家族已经出产了两位美国总统,或许在不久的将来便将诞生第三位,他就是小布什的侄子、被寄予厚望的小小布什。巧合的是,这位希望之星也叫乔治布什(全名为乔治普雷斯科特布什)。很多人都认为,如果有朝一日美国要选出一位有拉美血统总统的话,非普雷斯科特莫属。既然拥有黑人血统、毫无家族背景的奥巴马都能当选总统,那么这位布什家族的绩优潜力股又有何不可?    2000年7月17日,一位长相酷似拉丁歌王瑞奇马汀的
神医代代有,近来特别多。  六月初,在中国内地拥有万千拥趸的张悟本被揭学历造假。“悟本堂”停业,信众哗然,舆论纷起抨击;网络上,挺张与反张者争论连连,关于张悟本的讨论分成了泾渭分明的两种。  一方面,那些为张悟本叫屈的信众,认为张悟本避开了烦琐复杂的医学教条,为民众介绍了实在的养生知识——“没有推销药,只推销了茄子、绿豆……还有特别便宜的白萝卜,太傻了。”甚至有人直指:“如果大家都养生了,都不去医
博主:李银河  http://blog.sina.com.cn/s/blog_473d53360100mqf2.html    在批判男权制社会的伦理道德标准时,一些激进的女性主义者如吉利根提出了一个引发极大争议的观点,即女性道德优于男性道德。她指出,女性解决道德困境时有自己独特的方式:比较会考虑到别人、比较不会抱持优胜劣汰的观念与抽象唯理的原则。她认为女性文化重视养育与照料,习于息事宁人,而现今
日本在半导体产业尤其是处理器、SoC芯片等方向似乎没有太多声音。从近几年日本半导体产业发展来看,虽然具体的产品并没有太多,不过但凡有新品出现,都以独特的设计和规格让人眼前一亮。NEC在2017年发布了一款全新的矢量处理器,并在2018年正式将其推向市场。和传统的通用处理器、GPU加速器相比,矢量处理器还比较少见。今天,本文将和你一起解读NEC矢量处理器背后的秘密。  NEC在高性能处理器设计上拥有
本文作者苏小和新近出版的《中国企业家黑皮书》被称为“一份尖锐的官商结合调查报告”。  中国的企业家很累,既要应对市场的不确定性,更要应对政府管理的不确定性。我见过很多企业家在和政府官员打交道的时候,一副毕恭毕敬、点头哈腰的样子,也看见他们背地里骂娘,说在中国做生意真是难做;我见过企业家热衷于显摆自己和官员的良好关系,也看见有的企业家一旦发现官员倒台惟恐避之不及的场景。  黑,实在是太黑了;累,实在