论文部分内容阅读
虽说IT领域最至高无上的法则——摩尔定律,自1965年开始至今已统治相关产业的发展步伐将近半个世纪,但这些年来,面对处理器主频极限这座难以逾越的“珠峰”,摩尔定律也不得不适时地演绎出全新韵版本——扩展摩尔定律。也正是在这个“天条御律”的指引下,处理器的发展也开始从频率竞赛,转向多核齐冲。不仅如此,随着多核芯片技术的不断发展,一批能够进一步充分利用并行计算资源的新技术也纷纷浮出水面。
Intel贯彻全线多核战略
尽管Intel早在06年底、07年初就已先后通过Clovertown内核的Xeon 53系列双路服务器产品线和Kentsfield内核的Core 2 Quad Q6000/Core 2 Extreme QX6700系列桌面产品线,开始向4核处理器挺进,但鉴于高端企业计算,特别是关键应用领域对系统平台稳定性和迁移平顺性的重视,因此在多路服务器平台,Xeon仍继续沿用保守的双核产品。直到2007年9月6日,Intel全球发布了多路4核服务器平台的Xeon7300系列,才算彻底将其多核战略真正贯彻到全线服务器产品中。作为全球同步发布的、业界首款专为多路(MP)服务器设计的4核Intel Xeon 7300系列服务器处理器,它可满足企业应用环境中以及虚拟化应用环境中的服务器整合、数据库应用、企业资源规划和商务智能等应用时对服务器高性能、高可靠性和高可扩展性的需求。
与Intel前代双核产品相比,此次发布的六款全新4核Xeon 7300系列处理器的性能和性能功耗比分别提升了两倍和三倍之多。随着这些产品的发布,Intel也成功地在不到15个月的时间内完成了向酷睿微体系架构的快速切换。此平台的高能效性能表现和增强的虚拟化性能将帮助用户大幅度降低其总体拥有成本。
高能效的Xeon 7300系列产品包括主频高达2.93GHz旗舰型处理器(X系列,功耗为130W),4款80W主频在1.60GHz~2.40GHz的主流处理器(E系列),以及一款针对4路刀片式服务器和高密度机架式服务器优化的50W低功耗版处理器(L系列,主频为1.86GHz)。具备数据流量优化(Data Tramc Optimizations)特性的IntelXeon 7300芯片组采用平衡的平台设计,具有多项全新技术,以改善数据在处理器、内存和I/O之间的传输能力。
IO加速与虚拟化整合
处理器核心数量的不断翻倍,不但带来了更高的并行计算能力,同时也给系统资源整合与再利用奠定了基础。在这种大趋势下,虚拟化应用与IO加速技术也顺理成章地再次成为了人们关注的焦点。
我们有幸在上海紫竹工业园的英特尔服务器实验室里预先了解到了关于Intel最新一代7300服务器平台(Caneland)上虚拟化技术与IOAT技术的最新进展。
在7300平台上,Intel引入了新一代的IOAT2技术,这将有益于数据中心网络I/O的性能增强,如多端口10Gbps以太网、虚拟化、网络存储、应用快速响应、附加协议和附加的平台级加速。从英特尔服务器实验室提供的内部资料来看,IOAT2在前一代IO加速技术基础上增加了直接高级缓存访问(DCA),MSI-X、中断快速响应、头部分离/复制等技术。
其中,最关键的一项技术要数DCA。这是一项利用处理器高速缓存进行数据的直接访问、来最大限度地避免CPU重复存取内存的技术。其实际工作原理也就是令CPU高速缓存中的数据可以优先访问,这样就可以借助CPU内部缓存更低的数据存取延迟来大幅改善网络IO数据的综合传输性能。
此外,诸如一些智能地判断数据包类型并进行数据优化、将TCP/IP数据包头放入不同的内存缓冲进行分离/复制等细节技术的改进也都将令IOAT2在实际应用中得以显著改进。当然,要想充分发挥IOAT2的功效,你的终端网卡也必须支持最新的VMDq(Virtual IOQueues),该技术将在代号为Zoar的双千兆以太网芯片和代号为Oplin的双万兆以太网芯片中被引入。而按照Intel的预期,在2008年后期,还将会推出再下一代的IOAT3技术,届时它将在DMA通道数量、数据装载引擎带宽上都得到翻倍的改进,并融入下一代的VTd DMA技术,令IO传输能力在虚拟化环境中得到更充沛的释放。
四核皓龙
AMD作为PC领域第二大处理器厂商,自然也没有坐视不理,此前传闻已久、研发代号为巴塞罗那的四核皓龙处理器,终于在Intel 7300系列服务器平台发布几天后的9月10日,被正式公诸于众。自此也正式拉开了PC服务器领域多路4核平台竞争的序幕。
AMD的四核皓龙处理器(AMD称之为第三代皓龙处理器)在X86业界首次实现了在一个硅片上集成四个计算内核,再借助AMD皓龙固有的直连架构令其并行技术能力得以充分发挥。与Intel多核结构不同,四核皓龙处理器的每颗核心都仍然采用完全独立的设计,各自拥有64KB(数据)+64KB(指令)的L1缓存和512KB的L2缓存。但为了平衡多核芯之间的数据交叉调用、复用冲突,新内核引入了2MB共享式的L3缓存,并借助65nm工艺将所有这些都集成到了一颗晶圆芯片上,即所谓的原生4核结构。这里AMD同样延续了其一贯主张的独立缓存设计,即各级缓存间完全独立,无需进行内容映射,以大幅提高缓存利用率。此外,其L1缓存和L2缓存依然分别采用2路和16路结构,L3缓存则为32路,以满足高效、多任务并行计算的需要。
与此相呼应的是,9月11日,华硕也率先推出首款支持4核心的巴塞罗那处理器的RSl61-ES/PA2服务器。该产品也是全球首款通过AMD认证支持其双重动态电源管理(Dual DynamicPower Management,简称DDPM)技术的服务器,在节能降耗、散热等方面取得了重大突破。DDPM技术可以为CPU和内存控制器单独供电,并根据负载动态打开或关闭CPU中的部件,带来更强大的性能和更优的电源管理能力。同时,RSl61-E5/PA2还具备Dual Link、增强型PowerNow省电技术、AMD-V虚拟化技术等设计,从而令新一代四核皓龙服务器在整体性能功耗比方面也得以大幅精进。
小结>>
多核技术走到今天,已经相对成熟,无论是共享式大容量L2缓存,还是独立式L3缓存,也无论是完全集成在单一晶圆上的“原生4核”,抑或是整合在2个核心单元上的设计,总之我们都正步入4核时代。特别是在中高端的多路PC服务器市场,在虚拟化技术不断完善的大势下,多核的并行计算优势都将更加凸显。在接下来的一段时间内4核多路PC服务器的竞争将进一步升级,而这最终的结果自然是让企业用户可以用更少的IT投入,拥有具有更高性能功耗的产品。但要想将这些多核多路的高性能服务器真正用好,虚拟化应用技术则还必须得到一个快速的发展和普及。
Intel贯彻全线多核战略
尽管Intel早在06年底、07年初就已先后通过Clovertown内核的Xeon 53系列双路服务器产品线和Kentsfield内核的Core 2 Quad Q6000/Core 2 Extreme QX6700系列桌面产品线,开始向4核处理器挺进,但鉴于高端企业计算,特别是关键应用领域对系统平台稳定性和迁移平顺性的重视,因此在多路服务器平台,Xeon仍继续沿用保守的双核产品。直到2007年9月6日,Intel全球发布了多路4核服务器平台的Xeon7300系列,才算彻底将其多核战略真正贯彻到全线服务器产品中。作为全球同步发布的、业界首款专为多路(MP)服务器设计的4核Intel Xeon 7300系列服务器处理器,它可满足企业应用环境中以及虚拟化应用环境中的服务器整合、数据库应用、企业资源规划和商务智能等应用时对服务器高性能、高可靠性和高可扩展性的需求。
与Intel前代双核产品相比,此次发布的六款全新4核Xeon 7300系列处理器的性能和性能功耗比分别提升了两倍和三倍之多。随着这些产品的发布,Intel也成功地在不到15个月的时间内完成了向酷睿微体系架构的快速切换。此平台的高能效性能表现和增强的虚拟化性能将帮助用户大幅度降低其总体拥有成本。
高能效的Xeon 7300系列产品包括主频高达2.93GHz旗舰型处理器(X系列,功耗为130W),4款80W主频在1.60GHz~2.40GHz的主流处理器(E系列),以及一款针对4路刀片式服务器和高密度机架式服务器优化的50W低功耗版处理器(L系列,主频为1.86GHz)。具备数据流量优化(Data Tramc Optimizations)特性的IntelXeon 7300芯片组采用平衡的平台设计,具有多项全新技术,以改善数据在处理器、内存和I/O之间的传输能力。
IO加速与虚拟化整合
处理器核心数量的不断翻倍,不但带来了更高的并行计算能力,同时也给系统资源整合与再利用奠定了基础。在这种大趋势下,虚拟化应用与IO加速技术也顺理成章地再次成为了人们关注的焦点。
我们有幸在上海紫竹工业园的英特尔服务器实验室里预先了解到了关于Intel最新一代7300服务器平台(Caneland)上虚拟化技术与IOAT技术的最新进展。
在7300平台上,Intel引入了新一代的IOAT2技术,这将有益于数据中心网络I/O的性能增强,如多端口10Gbps以太网、虚拟化、网络存储、应用快速响应、附加协议和附加的平台级加速。从英特尔服务器实验室提供的内部资料来看,IOAT2在前一代IO加速技术基础上增加了直接高级缓存访问(DCA),MSI-X、中断快速响应、头部分离/复制等技术。
其中,最关键的一项技术要数DCA。这是一项利用处理器高速缓存进行数据的直接访问、来最大限度地避免CPU重复存取内存的技术。其实际工作原理也就是令CPU高速缓存中的数据可以优先访问,这样就可以借助CPU内部缓存更低的数据存取延迟来大幅改善网络IO数据的综合传输性能。
此外,诸如一些智能地判断数据包类型并进行数据优化、将TCP/IP数据包头放入不同的内存缓冲进行分离/复制等细节技术的改进也都将令IOAT2在实际应用中得以显著改进。当然,要想充分发挥IOAT2的功效,你的终端网卡也必须支持最新的VMDq(Virtual IOQueues),该技术将在代号为Zoar的双千兆以太网芯片和代号为Oplin的双万兆以太网芯片中被引入。而按照Intel的预期,在2008年后期,还将会推出再下一代的IOAT3技术,届时它将在DMA通道数量、数据装载引擎带宽上都得到翻倍的改进,并融入下一代的VTd DMA技术,令IO传输能力在虚拟化环境中得到更充沛的释放。
四核皓龙
AMD作为PC领域第二大处理器厂商,自然也没有坐视不理,此前传闻已久、研发代号为巴塞罗那的四核皓龙处理器,终于在Intel 7300系列服务器平台发布几天后的9月10日,被正式公诸于众。自此也正式拉开了PC服务器领域多路4核平台竞争的序幕。
AMD的四核皓龙处理器(AMD称之为第三代皓龙处理器)在X86业界首次实现了在一个硅片上集成四个计算内核,再借助AMD皓龙固有的直连架构令其并行技术能力得以充分发挥。与Intel多核结构不同,四核皓龙处理器的每颗核心都仍然采用完全独立的设计,各自拥有64KB(数据)+64KB(指令)的L1缓存和512KB的L2缓存。但为了平衡多核芯之间的数据交叉调用、复用冲突,新内核引入了2MB共享式的L3缓存,并借助65nm工艺将所有这些都集成到了一颗晶圆芯片上,即所谓的原生4核结构。这里AMD同样延续了其一贯主张的独立缓存设计,即各级缓存间完全独立,无需进行内容映射,以大幅提高缓存利用率。此外,其L1缓存和L2缓存依然分别采用2路和16路结构,L3缓存则为32路,以满足高效、多任务并行计算的需要。
与此相呼应的是,9月11日,华硕也率先推出首款支持4核心的巴塞罗那处理器的RSl61-ES/PA2服务器。该产品也是全球首款通过AMD认证支持其双重动态电源管理(Dual DynamicPower Management,简称DDPM)技术的服务器,在节能降耗、散热等方面取得了重大突破。DDPM技术可以为CPU和内存控制器单独供电,并根据负载动态打开或关闭CPU中的部件,带来更强大的性能和更优的电源管理能力。同时,RSl61-E5/PA2还具备Dual Link、增强型PowerNow省电技术、AMD-V虚拟化技术等设计,从而令新一代四核皓龙服务器在整体性能功耗比方面也得以大幅精进。
小结>>
多核技术走到今天,已经相对成熟,无论是共享式大容量L2缓存,还是独立式L3缓存,也无论是完全集成在单一晶圆上的“原生4核”,抑或是整合在2个核心单元上的设计,总之我们都正步入4核时代。特别是在中高端的多路PC服务器市场,在虚拟化技术不断完善的大势下,多核的并行计算优势都将更加凸显。在接下来的一段时间内4核多路PC服务器的竞争将进一步升级,而这最终的结果自然是让企业用户可以用更少的IT投入,拥有具有更高性能功耗的产品。但要想将这些多核多路的高性能服务器真正用好,虚拟化应用技术则还必须得到一个快速的发展和普及。