CPU如何影响IA服务器的性能

来源 :互联网世界 | 被引量 : 0次 | 上传用户:xtljj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  人们在购买服务器时,往往希望CPU的速度越快越好,因为人们认为CPU越快,服务器的性能就越好,然而,事实并非如此简单。通过性能测试并对结果进行分析,我们发现速度仅是影响服务器性能的CPU诸因素中的一方面,还存在很多甚至更重要的CPU的其他因素影响服务器性能的发挥。以下将重点分析CPU诸因素中对服务器性能有较大影响的一些因素,以方便人们在选购IA服务器时参考。


  在具体分析之前,我们先来看一张表,此表提供了Intel公司Pentium系列CPU的一些重要参数,以有利于下文分析。
  
  Intel CPU主要组成部件
  
  以Intel公司的Pentium II CPU为例,构成CPU的主要部件有:
  1.CPU内核(Pentium Processor Core):是真正意义上的处理器,用于执行指令和处理数据,其计算能力与CPU的速度密切相关。
  2.一级缓存(L1 Cache):高速缓存器,为CPU提供其计算所需的指令和数据,与CPU内核同频工作。一般由指令缓存器和数据缓存器两个分离的大小相等的部分组成。目前大小分别为16KB。
  3.二级缓存(L2 Cache):高速缓存器,提供CPU计算所需的指令和数据。通常由三个部件组成:L2 Cache Controller,Cache SRAM,Cache tag RAM。分别用作控制器,存储器和缓存检索表。
  4.BSB(Backside Bus):通常称之为后端总线。互连CPU内核和二级缓存的总线。主要负责向CPU提供L2 Cache所存储的指令和数据。从表上可以看出,BSB提供了66MHz,半速,全速三种速度。半速指BSB工作频率是CPU主频的一半;全速指BSB工作频率与CPU主频相同。BSB速度决定了CPU访问Cache的速度。由于CPU所需的指令和数据主要来自于L2 Cache,所以BSB速度对系统性能有非常重要的影响。据测试,一个200MHz的Pentium Pro系统性能要优于一个PII 233的性能,主要原因在于前者的BSB速度为200MHz,而后者仅为116MHz。
  5.FSB(Frontside Bus):即通常所说的前端总线。互连CPU和主板芯片组的总线,一般用于互连CPU和内存控制器。FSB的速度即是通常所说的外频。FSB速度的高低影响CPU对主内存的存取。目前主流的外频为133MHz,服务器部分(四路至强处理器的服务器)仍采用100 MHz。
  
  Intel Pentium III CPU介绍
  
  如果您对CPU比较关注的话,会发现目前PIII CPU有带“E”和带“B”的两种,E代表采用ATC技术的CPU;B代表支持133MHz外频的CPU;若两者都具备则该CPU称之为EB型。对于外频为133大家较易理解,无非是提高CPU访问内存的带宽。那么ATC指的是什么呢?
  由于第二代PIII CPU采用了0.18微米的加工工艺,与第一代相比其CPU内核芯片面积减少了30%。为此Intel将内核芯片和L2 Cache芯片封装在同一芯片内,于是用于连接CPU内核和L2 Cache的BSB可做得非常短,更利于解决高速传输中的电气噪音等干扰问题,提供了以前仅在P-Pro和Xeon CPU才提供的全速通信,大大提高处理器访问L2 Cache的速度。另一方面,在BSB方面有一重大突破是BSB的数据宽度由以前的64位上升为256位。这一提高对系统尤其是CPU有何影响呢?
  为了改进性能,Intel处理器访问内存时采用一种称之为Cache Line的技术。每次CPU访问内存时,以Cache Line为单位,请求一个或多个Cache Line。对于P5和P6类CPU来说,一个Cache Line由32字节的数据或指令组成,也就是一个Cache Line共256位,当CPU向L2 Cache请求1个Cache Line时,那么将从BSB上向CPU传输256位数据或指令,如果BSB为64位宽,那么至少要分4次传输,如果每次传输能在1个Clock tick内完成,则传完一个Cache Line至少需要4个Clock tick;若BSB数据宽度为256位,则只需在1个Clock tick内完成。
  显然第二代PIII CPU即Coppermine和Cascades大大减少了访问L2 Cache的时延,进而提高系统性能。Intel将此种技术(256位的BSB总线技术)称为Advanced Transfer Cache,简称ATC。
  Intel不仅改进了BSB总线技术,而且在L2 Cache内部性能上也有重大改进。
  Coppermine和Cascades的L2 Cache将第一代L2 Cache的4路集关联(4-way set associative)提高到8路集关联。缓存关联度的提高不仅减少了检索存储在L2 Cache里内存地址的查询时间而且提高了L2 Cache的命中率。
  总而言之,Coppermine和Cascades与第一代PIII CPU相比最大的改进是采用了ATC技术,以及提高L2 Cache的关联度。
  关于Coppermine和Cascades的比较:二者采用相同的处理器和相同的全速L2 Cache。据测试一个256KB L2 Coppermine与256KB L2 Cascades有相同的性能。然而Cascades(即目前的PIII Xeon)具有以下特点:
  (1)能访问最多达64GB的内存,而Coppermine仅能访问4GB内存
  (2)支持2MB的L2 Cache,而Coppermine仅有256KB的L2 Cache。
  (3)在一条FSB上可以最多支持4颗处理器,而Coppermine仅能支持2颗。
  可见,PIII Xeon处理器比PIII CPU在性能上有了很大的提高,这也是为什么采用至强处理器的服务器的价格要高于采用普通处理器的服务器。象方正电脑的圆明4100服务器的价格就高于圆明1700服务器几万元。
  
  CPU速度、CPU数量、L2 Cache与服务器性能
  
  1.CPU速度与服务器性能
  CPU速度对服务器的性能有非常重要的影响。许多人希望通过升级CPU的时钟频率来提高系统性能。那么究竟能提高多少呢?一般可按如下公式计算:
  若CPU1主频为M1,CPU2主频为M2,CPU1和CPU2采用的是相同技术,M2 > M1,且M2 - M1 < 200MHz,则配置CPU2较配置CPU1性能提升(M2 - M1)/ M1×50%。这通常称之为CPU的50%定律。一般地两CPU主频越接近,越符合此50%定律。
  2.CPU数量与服务器性能


  当前IA服务器采用多CPU系统的越来越普遍,而这其中更多的是支持SMP,即对称多处理。SMP使系统中的多个CPU可对称地访问系统的所有硬件资源譬如内存、I/O总线和中断,由于每一个CPU所看到的是同一硬件资源。所以SMP硬件的扩展性直接关系到多个CPU共享硬件资源的效率。
  目前只有Xeon(至强)系列CPU才支持大于2路的SMP系统。Pentium II和Pentium III只支持2路SMP。
  SMP与服务器的应用有直接关系,下图是不同服务器应用类型对CPU数量的敏感度。
  从上图可以发现对文件或打印服务器而言,增加一个CPU并不能明显地增加性能,CPU由1增加到2个时性能有稍许提高,但继续增加时性能反而降低。对于数据库或其他应用服务器而言,系统性能与CPU的数量相关性较大,从图上可以看出增加1到3个CPU系统的处理能力有明显提高。
  增加服务器的CPU时究竟对性能有何影响?假设一款可支持8路SMP Xeon CPU的高端服务器,系统的内存足够大,网络速度和硬盘速度足够快。也就是增加CPU时系统不存在瓶颈。CPU数量与性能的关系如图2。


  一般说来,CPU的扩展性具有如下特点:
  对于标准的不带ATC特点的Xeon CPU如Tanner,扩展CPU所带来的性能增长情况如下:
  1 CPU=1
  2 CPU=1.7
  4 CPU=3.0
  8 CPU=5.0
  对于目前最新的具有ATC技术的Cascades PIII Xeon CPU来说,其扩展性能如下:
  1 CPU=1
  2 CPU=1.6
  3 CPU=1.9
  4 CPU=2.0
  从上面所显示的扩展情况来看,Cascades的扩展性能似乎没有Non-ATC的CPU如Tanner好。从目前的测试情况来看上述结果是真实的。然而这并不表明标准的Xeon CPU就比Cascades的扩展性能好。Cascades所产生的扩展问题主要有以下两方面原因:
  (1)单Cascades CPU的起点性能高,相对说来扩展时增加的绝对值相对较小。
  (2)当CPU数量增加时,内存所产生的瓶颈影响越来越大。
  采用ATC技术的Cascades CPU性能发挥更依赖于高速内存,而目前除了可以采用内存多路交叉存取访问技术以提高内存性能之外,用户自己是不能控制内存带宽的。所以随着CPU的数量增加,内存产生的瓶颈也就越来越明显。只有依靠更新的内存控制器技术和内存技术,提供更快的内存才能满足下一代处理器的需求。
  3.L2 Cache与服务器性能
  处理器性能是一复杂的话题,因为CPU的性能更多地被系统结构、操作系统、应用和工作负荷等因素所影响。一般说来服务器需要随时处理来自不同用户的请求。所以CPU处理的数据更具突发性和随机性,而不象桌面系统具有连续性。所以CPU所需要的指令和数据主要是由L2 Cache提供。因此对于一台服务器来说L2 Cache的大小对系统性能是有重要影响的。我们曾经测试过方正圆明3000N服务器,发现一个2MB L2 Cache的450MHz Xeon CPU较同频的512KB L2Cache有约10%提升。
  随着CPU数量的增加,L2 Cache大小对系统性能的影响也越来越明显。譬如对于一个4路的SMP服务器而言,当只安装一个CPU时,对内存访问几乎未有竞争,因此若L2 Cache不能满足CPU的需求时,内存可以在CPU等待之前做出响应,所以CPU的运行状况与L2 Cache的命中率几乎无关。
  另一方面,若安装了4颗Xeon CPU,那么访问内存的队列、访问内存的时间将明显增加,从而增加了CPU的潜在等待时间,在这种情况下,L2 Cache的高命中率将节省大量的时间,显著提高处理器的性能。总的说来,CPU越多,越大的L2 Cache给系统带来的性能越明显:
  对于1或2个CPU而言,L2 Cache大小增加一倍,系统性能提高3%~5%;对于3或4个CPU而言,L2 Cache大小增加一倍,系统性能提高6%~12%;对于8个CPU而言,L2 Cache大小增加一倍,系统性能提高15~20%;
  最后给大家提供一个参考建议,这是在研发方正圆明服务器时根据测试结果总结出来的、有关不同数量、不同主频、不同型号CPU配置的服务器性能对比情况,供大家参考。
  目前方正圆明系列服务器已全面采用第二代Pentium III CPU。部门级服务器圆明2200,标配支持133外频和ATC缓存技术的PIII Xeon 866MHz CPU,最大可达到2颗。圆明1700、1600R标配支持ATC 缓存技术的PIII 700 MHz CPU,最大可支持2颗。圆明4100支持4颗PIII Xeon CPU,内存最大可支持16GB ECC SDRAM,目前标配为2颗或1颗700MHz CPU、1MB二级缓存、512MB内存,充分根据本文所分析的性能增长情况配置,通过第三方性能测试实验室测试,圆明4100的Serverbench结果也高达1400TPS以上。显示了圆明4100强大的客户请求处理能力,可以为用户的数据库、数据仓库或电子商务应用提供最佳性能。
其他文献
《阿里巴巴和四十大盗》故事新篇:  一日,阿里巴巴又窥见强盗们新掠来一批财宝,他们将财宝带到原来的藏宝山洞处,对着门口的一个东东讲了一句“芝麻开门”,山洞大门应声而开,强盗们鱼贯而入,放下财宝后扬长而去。阿里巴巴心中狂喜:“今天又能发大财了!”他走到山洞门前,模仿强盗的口吻说:“芝麻开门。”然而山洞的大门纹丝未动。“纸马开门,织吗开门……”阿里巴巴又换了不同的音调,结果还是白费力气。突然,他看见门
期刊
我们处在一个世界变化日新月异、技术发展层出不穷的信息时代。计算机网络为人类创造了一个全新的信息空间,电子商务是其最具有代表性的产物之一:它通过电子手段建立了一种全新的经济秩序,已经或正在对传统的经济模式发起强有力的冲击,也必然对人们的生活方式产生深远的影响。于是人们很自然地要求对电子商务有一个深入的认识。不但如此,电子商务所提供的巨大的商业机会正促使越来越多的企业投身其中,对于电子商务高级人才的需
期刊
生逢“e”时代    每一个新时代的到来都是有人得意、有人失意,有人哀叹生不逢时,有人感怀自己应时而生。1998年5月联想-SUN分销中心成立之时,似乎只是一类产品行销体系中普通的一环、联想科技发展有限公司的又一个产品部。时隔年余,当空气中到处弥漫着“e”的味道时,联想-SUN分销中心正式独立成为联想神州数码有限公司SUN事业部。在SUN事业部的成员看来,这种转变并非是一场美丽的“蝶变”,而是一种
期刊
走上电子商务之路的传统企业,必然会面临四方面的变革,即:技术的变革,结构的变革,流程的变革和文化的变革。    技术的变革    互联网技术已经成为目前世界上最流行,最可靠的电子商务媒介。传统企业投身电子商务首先必须考虑全面采用互联网技术,无论是客户和市场的沟通、集团成员之间、企业内部沟通方面,还是与供应市场、供应商、合作伙伴之间都要尽量采用成熟的互联网技术。互联网技术的最大优势在于您的电子商务系
期刊
防火墙是在内外网络之间执行控制策略的系统(包括硬件和软件),目的是不被外部非法用户侵入内部网。本质上,它遵循的是一种允许或禁止业务来往的网络通信安全机制,也就是提供可控的过滤网络通讯,只允许授权的通讯。  NetScreen防火墙在网络层中对数据包实施有选择的通过,依据系统事先设定好的过滤逻辑,检查数据流中的每个数据包,根据数据包的源地址、目标地址、以及包所使用端口确定是否允许该类数据包通过,并使
期刊
2000年9月6日,对联想人来说,是一个难以忘怀的日子。在庄严肃穆的人民大会堂,来自全国各地的联想集团的合作伙伴、联想神州数码的全体员工济济一堂,共同庆祝联想集团全面进军电子商务暨联想神州数码的诞生。联想集团总裁柳传志在这个庄严的时刻,郑重地宣布联想神州数码有限公司正式成立。其针对IT产品经销商和厂商的B to B电子商务平台(e-bridge)正式启动,从而吹响了联想集团全面进军互联网的号角。 
期刊
拥有中国自主的操作系统,一直以来都是中国IT业的一个解不开的心结。从DOS和WINDOWS3.1时代开始,不论是UCDOS、中文之星,还是COSIX,还有去年维纳斯与女娲较量中的Hopen,都反映出国人对自主操作系统始终的梦想与期待。互联网络的高速发展与应用,信息时代的迫近,使得这场操作系统之争,更上升到关乎国家安全和对中国信息产业持续发展具有重大意义的高度。  自由软件Linux的出现,使国人看
期刊
政府上网工程如火如荼地展开了,这现象的确令人振奋。为此,由域名温度计(www.hotname.com.cn)与政府上网工程服务中心(www.gov.cn)共建了政府域名排行的专栏,已经于7月份开始提供相关的统计数据。从7月份的统计数据看(见图1),海南省可谓出尽了风头,鹤立鸡群,遥遥领先,注册的政府域名有90多个。排名第二、第三的分别是:广东省、山东省。不过风云变化莫测,让我们来看看8月份状况如何
期刊
信息技术的迅速发展和广泛应用彻底地改变了所有商业的运作方式,从发展迅猛的中小型公司到拥有广泛资源的全球跨国企业,信息在企业的决策、经营和管理中发挥着越来越重要的作用。特别是基于Internet和Intranet的电子商务、企业资源计划(ERP)、数据仓库、联机事务处理(OLTP)等数据密集型应用的兴起,数据量的爆炸性增长,对数据的存储、共享和安全都提出了更高的要求。建立一个具有大规模可伸缩性、24
期刊
8月25日,正值清华紫光股票网上发行一周年的日子,清华紫光股份有限公司在北京举行了“紫光网络,凭e近人”网络新产品发布会。作为清华紫光向网络领域进军的重大举措,此次清华紫光发布的网络产品和解决方案几乎覆盖了所有网络应用领域,并具有良好的兼容性且易于安装和配置,这些产品充分体现了紫光在“网络应用整体解决技术”方面的巨大进步。  “为用户提供全面的网络应用解决方案!”是清华紫光1998年成功上市后所提
期刊