论文部分内容阅读
出门在外的PC用户要求很长的电池续航时间,但又不想牺牲性能。兼顾这些相互矛盾的需求是英特尔新的处理器架构(代号为Haswell)的核心,这种架构有望出现在2013年交付的平板电脑、超极本及其他电脑中。
沈建苗编译
在本周早些时候举行的2012年英特尔开发者论坛(IDF)上,英特尔比较深入地介绍了开发Haswell的由来。
也许“tock”(新架构)是一个更合适的字眼,因为Haswell代表了英特尔处理器发展计划中的“新架构”。英特尔用“tick-tock”(工艺年-架构年)来表示其处理器发展战略。“tick”(新工艺)表示现有的处理器设计只经过了小幅调整,但又享有新制造工艺的所有效率。Ivy Bridge代表新工艺,它对Sandy Bridge进行了逐步改进,但改用22nm工艺。与此同时,像Haswell这些新架构总是建立在成熟的制造工艺上,而英特尔的22nm制造工艺久经考验,这归功于该公司的Ivy Bridge系列。所以,Haswell代表“新架构。”
不过,Haswell不仅仅是另一款英特尔PC处理器。英特尔眼下在谈论各种基于Haswell的处理器:有的是功耗不到10瓦的双核芯片,因而适合用于平板电脑;有的是四核台式机处理器,性能胜过速度最快的Ivy Bridge处理器。英特尔到底是如何实现将电源效率提高20倍这个宏伟目标的?深入剖析处理器本身之前,Haswell的电源管理技术值得关注。
活动闲置状态
现代处理器的电源管理需要在必要时,根据你要求设备处理的任何任务,关闭供给处理器中大部分元件的电源。英特尔使用直接内置在主处理器中的一种特殊处理单元——英特尔称之为电源控制单元(Power Control Unit),就能几乎在晶体管这个层面管理电源。电源控制单元监测处理器的哪些部分没有被使用,然后根据需要开启或关闭那部分元件。
不过,问题不是让处理器的某些部分处于睡眠状态。问题是以足够快的速度唤醒处理器,以便随时可用。毕竟,如果每次笔记本电脑进入睡眠状态都要等上一分钟,那么你在沮丧之下,可能会将笔记本电脑一扔了之。英特尔处理器(直到Ivy Bridge)有两个主状态:活动状态和睡眠状态。(实际情况比这要复杂,不过原理大抵如此。)这些年来,英特尔稳步缩短了唤醒睡眠中处理器所用的时间。最新的Ivy Bridge处理器只需要几秒钟时间,就能从深度睡眠状态唤醒过来。不过,几秒钟离“即时开机”仍有一点距离。
Haswell的解决方案是添加第三种电源状态,英特尔的设计师们称之为“活动闲置”(Active Idle)。活动闲置状态又称SOix,这是一种功耗极低的活动状态,耗电量比Ivy Bridge少20倍。PC系统本身认为它醒着,但处理器仍然基本上处于睡眠状态。这一技术意味着唤醒时间最长也只有几百毫秒。从用户的角度来看,最长半秒的唤醒时间远胜过唤醒目前的处理器所需要的好几秒。Haswell在运行时,几乎总是处在这个“即时恢复”状态。这项技术主要直接借鉴了英特尔的凌动处理器电源管理。
英特尔在制造Haswell时还运用了另外几项技巧。前面我们谈到了闲置状态和睡眠状态。睡眠状态和活动闲置状态实际上被细成了多个较小的状态。每个小状态(名为“C状态”)定义了具体关闭处理器的哪个部分。Haswell增加了新的C状态,实现更精细的电源管理。这提供了更长的电池续航时间,因为你的处理器不会为了唤醒处理器中的确需要唤醒的某部分而不断唤醒不需要唤醒的那部分。
英特尔还关注了处理器耗电量与系统显示屏有怎样的联系。的确,在如今的系统中花很长时间来唤醒的一个部件就是液晶面板,于是Haswell处理器将含有面板自我刷新机制。因此,举例来说,如果你就坐在那里、盯着屏幕,Haswell处理器就会进入睡眠状态,只有一小部分元件保持清醒状态,刷新显示器??。只要你移动鼠标或按一下键,处理器就被唤醒。你注意不到唤醒时间,因为显示屏从来没有进入睡眠状态。
现在大家对英特尔如何获得更高的电源效率应该有所了解,我们不妨谈谈处理器架构方面的改进。
更高的性能和更好的电源效率
在IDF的其中一场技术会议上,英特尔高级首席工程师Ronak Singhal屡次重复:要是会带来电源开销,不会为处理器添加任何新特性。即便如此,处理器设计师们还是拥有许多技巧,在兼顾电源要求的同时,提高性能。
一个技巧是分支预测,这让处理器可以提前看一下哪些指令可能会在近期执行。如果处理器知道哪些指令会从管道上下来,那么分配处理器资源的效率有望大大提高,只开启处理器中需要的那些部分元件。所以,英特尔调整了架构元件,以改进分支预测,包括加大内部缓冲存储器和扩大乱序窗口。
此外,处理器在一个周期内处理的工作越多,它在耗电量一样的情况下性能越高。因此,英特尔增添了每个时钟周期处理两个浮点乘加运算的功能,因而在耗电量一样的情况下,性能比Ivy Bridge提高了一倍。一级和二级缓存吞吐量也得到了提高,缩短了处理器等待数据到达所花的时间。
当然,这一切好处不是免费就能得到的。虽然电源效率有所提高,但缺点是加大了芯片尺寸。考虑到Haswell仍将采用22nm制造,芯片本身的尺寸很可能大于Ivy Bridge处理器。
同样由于另一个原因:图形功能,芯片尺寸可能会增加。
平板电脑上玩高端PC游戏:Haswell图形功能
Haswell基于Sandy Bridge中现有的英特尔高清图形核心,主要添加了一些改善,并提高了电源效率。Haswell现在为英特尔处理器提供三种不同的集成显卡选项,名为GT1、GT2和GT3,而不是Ivy Bridge的两种选项(英特尔HD 2500和HD 4000)。
从性能的角度来看,GT3最值得关注。GT3仅仅把执行单元的数量增加了一倍,因而性能比之前的HD 4000 GPU提高了一倍。执行单元是GPU的核心计算引擎,处理图形着色器和GPU计算任务。这些执行单元做入到共同的模块化单元,英特尔称之为“共用切片”(slice common)。 这块共用切片还包含许多其他的关键部件,用于处理实时图形,比如光栅引擎和高速缓存。为了将计算引擎数量比HD 4000增加一倍,英特尔只是为GT3添加了第二块共用切片。这占用额外的芯片空间,但实际上省了电,因为GPU不需要进入加速模式,就能进一步提升性能。
还对GPU进行了其他调整,包括改进纹理采样器、提高总体带宽以及增加更多电路,处理目前由HD 4000的驱动程序来处理的任务。
这些功能都有助于在不增加耗电量的情况下提高性能。英特尔估计,8瓦的Haswell单元有望集成整个GT3 GPU,不过没有给出产品版本方面的具体内容。英特尔展示了两种不同应用的运行情况:Unigine Heaven,这是合成图形基准测试,以及Bethesda’s Skyrim,这是对图形要求颇高的一款PC角色扮演游戏。Haswell在运行这两项测试时性能均比Ivy Bridge提高一倍,提供了流畅得多的视觉体验。
以前,英特尔在为最新的编程接口添加软件支持方面动作很晚。Haswell改变了这种局面,它实施了所有的最新标准:面向Windows 7和Windows 8的DirectX 11.1、面向GPU计算的OpenCL 1.2以及OpenGL 4.0。英特尔在驱动程序支持方面一向做得很好,提供了Windows驱动程序和Linux驱动程序。
虽然Haswell的3D图形引擎比之前英特尔在这方面的工作大有改进,但是台式机用户可能仍想要高端的独立显卡,以获得最佳的PC游戏性能。但是Haswell的图形核心有望使极薄的超极本成为还不错的游戏平台,而新的GPU为用户在基于Haswell的平板电脑上玩现代PC游戏提供了可能。
视频引擎
Ivy Bridge推出了QuickSync视频模块,这种是内置在GPU中的功能固定的专用视频单元。制造功能固定的视频引擎能够大大提升视频编码和解码的性能。但缺点是,它不是可编程的,所以如果出现了某种热门的新HD编解码器,视频引擎就处理不了。考虑到视频编解码器相当标准化,这不太可能。
不过,英特尔的确为Haswell视频引擎添加了额外的编解码器支持。运动JPEG(MJPEG)对视频会议而言很重要。SVC即可扩展视频编解码器在移动环境下很有用;在这种环境下,视连接速度而定,视频质量可能有所变化,所以视频质量可以从容扩展。即使网络带宽下降,用户们仍会看到良好的帧速率,而不会出现帧抖动或帧丢失。另外还增添了对4K视频的支持,支持即将上市的新一代超高清面板。
结论:更大的芯片、更好的性能、更低的功耗
Haswell会比Ivy Bridge更占用芯片空间;换句话说,这对英特尔来说每个处理器的成本更高,因为它无法在一块圆晶片上制造一样多的Haswell处理器。不过,Haswell的模块性多少缓解了这个问题;模块性让英特尔得以制造许多不同的Haswell产品,以尺寸较小的版本针对耗电量较低的小众市场。更棒的是,Haswell为英特尔的下一代14nm制造工艺作好了充分准备。
与Ivy Bridge相比,对主处理器所作的性能方面的调整大多数是渐进的。在一样的时钟频率下,用户可能会看到性能提升幅度达到10%。电源效率和图形性能有了大幅提升。电源效率的改进将使笔记本电脑终于有望像超极本那样电池续航时间长达一整天,而GPU改进意味着移动用户外出时也能享受相当爽的游戏体验。
Haswell有望成为历史上对英特尔的收入影响最大的一款处理器。新处理器的模块性和电源效率能带来一大批产品,市面上可能会出现外观尺寸迥异的Haswell产品。用户将成为受益者,因为在移动电脑和台式机方面有更多的选择,而性能有所提升,电池续航时间有所延长。
沈建苗编译
在本周早些时候举行的2012年英特尔开发者论坛(IDF)上,英特尔比较深入地介绍了开发Haswell的由来。
也许“tock”(新架构)是一个更合适的字眼,因为Haswell代表了英特尔处理器发展计划中的“新架构”。英特尔用“tick-tock”(工艺年-架构年)来表示其处理器发展战略。“tick”(新工艺)表示现有的处理器设计只经过了小幅调整,但又享有新制造工艺的所有效率。Ivy Bridge代表新工艺,它对Sandy Bridge进行了逐步改进,但改用22nm工艺。与此同时,像Haswell这些新架构总是建立在成熟的制造工艺上,而英特尔的22nm制造工艺久经考验,这归功于该公司的Ivy Bridge系列。所以,Haswell代表“新架构。”
不过,Haswell不仅仅是另一款英特尔PC处理器。英特尔眼下在谈论各种基于Haswell的处理器:有的是功耗不到10瓦的双核芯片,因而适合用于平板电脑;有的是四核台式机处理器,性能胜过速度最快的Ivy Bridge处理器。英特尔到底是如何实现将电源效率提高20倍这个宏伟目标的?深入剖析处理器本身之前,Haswell的电源管理技术值得关注。
活动闲置状态
现代处理器的电源管理需要在必要时,根据你要求设备处理的任何任务,关闭供给处理器中大部分元件的电源。英特尔使用直接内置在主处理器中的一种特殊处理单元——英特尔称之为电源控制单元(Power Control Unit),就能几乎在晶体管这个层面管理电源。电源控制单元监测处理器的哪些部分没有被使用,然后根据需要开启或关闭那部分元件。
不过,问题不是让处理器的某些部分处于睡眠状态。问题是以足够快的速度唤醒处理器,以便随时可用。毕竟,如果每次笔记本电脑进入睡眠状态都要等上一分钟,那么你在沮丧之下,可能会将笔记本电脑一扔了之。英特尔处理器(直到Ivy Bridge)有两个主状态:活动状态和睡眠状态。(实际情况比这要复杂,不过原理大抵如此。)这些年来,英特尔稳步缩短了唤醒睡眠中处理器所用的时间。最新的Ivy Bridge处理器只需要几秒钟时间,就能从深度睡眠状态唤醒过来。不过,几秒钟离“即时开机”仍有一点距离。
Haswell的解决方案是添加第三种电源状态,英特尔的设计师们称之为“活动闲置”(Active Idle)。活动闲置状态又称SOix,这是一种功耗极低的活动状态,耗电量比Ivy Bridge少20倍。PC系统本身认为它醒着,但处理器仍然基本上处于睡眠状态。这一技术意味着唤醒时间最长也只有几百毫秒。从用户的角度来看,最长半秒的唤醒时间远胜过唤醒目前的处理器所需要的好几秒。Haswell在运行时,几乎总是处在这个“即时恢复”状态。这项技术主要直接借鉴了英特尔的凌动处理器电源管理。
英特尔在制造Haswell时还运用了另外几项技巧。前面我们谈到了闲置状态和睡眠状态。睡眠状态和活动闲置状态实际上被细成了多个较小的状态。每个小状态(名为“C状态”)定义了具体关闭处理器的哪个部分。Haswell增加了新的C状态,实现更精细的电源管理。这提供了更长的电池续航时间,因为你的处理器不会为了唤醒处理器中的确需要唤醒的某部分而不断唤醒不需要唤醒的那部分。
英特尔还关注了处理器耗电量与系统显示屏有怎样的联系。的确,在如今的系统中花很长时间来唤醒的一个部件就是液晶面板,于是Haswell处理器将含有面板自我刷新机制。因此,举例来说,如果你就坐在那里、盯着屏幕,Haswell处理器就会进入睡眠状态,只有一小部分元件保持清醒状态,刷新显示器??。只要你移动鼠标或按一下键,处理器就被唤醒。你注意不到唤醒时间,因为显示屏从来没有进入睡眠状态。
现在大家对英特尔如何获得更高的电源效率应该有所了解,我们不妨谈谈处理器架构方面的改进。
更高的性能和更好的电源效率
在IDF的其中一场技术会议上,英特尔高级首席工程师Ronak Singhal屡次重复:要是会带来电源开销,不会为处理器添加任何新特性。即便如此,处理器设计师们还是拥有许多技巧,在兼顾电源要求的同时,提高性能。
一个技巧是分支预测,这让处理器可以提前看一下哪些指令可能会在近期执行。如果处理器知道哪些指令会从管道上下来,那么分配处理器资源的效率有望大大提高,只开启处理器中需要的那些部分元件。所以,英特尔调整了架构元件,以改进分支预测,包括加大内部缓冲存储器和扩大乱序窗口。
此外,处理器在一个周期内处理的工作越多,它在耗电量一样的情况下性能越高。因此,英特尔增添了每个时钟周期处理两个浮点乘加运算的功能,因而在耗电量一样的情况下,性能比Ivy Bridge提高了一倍。一级和二级缓存吞吐量也得到了提高,缩短了处理器等待数据到达所花的时间。
当然,这一切好处不是免费就能得到的。虽然电源效率有所提高,但缺点是加大了芯片尺寸。考虑到Haswell仍将采用22nm制造,芯片本身的尺寸很可能大于Ivy Bridge处理器。
同样由于另一个原因:图形功能,芯片尺寸可能会增加。
平板电脑上玩高端PC游戏:Haswell图形功能
Haswell基于Sandy Bridge中现有的英特尔高清图形核心,主要添加了一些改善,并提高了电源效率。Haswell现在为英特尔处理器提供三种不同的集成显卡选项,名为GT1、GT2和GT3,而不是Ivy Bridge的两种选项(英特尔HD 2500和HD 4000)。
从性能的角度来看,GT3最值得关注。GT3仅仅把执行单元的数量增加了一倍,因而性能比之前的HD 4000 GPU提高了一倍。执行单元是GPU的核心计算引擎,处理图形着色器和GPU计算任务。这些执行单元做入到共同的模块化单元,英特尔称之为“共用切片”(slice common)。 这块共用切片还包含许多其他的关键部件,用于处理实时图形,比如光栅引擎和高速缓存。为了将计算引擎数量比HD 4000增加一倍,英特尔只是为GT3添加了第二块共用切片。这占用额外的芯片空间,但实际上省了电,因为GPU不需要进入加速模式,就能进一步提升性能。
还对GPU进行了其他调整,包括改进纹理采样器、提高总体带宽以及增加更多电路,处理目前由HD 4000的驱动程序来处理的任务。
这些功能都有助于在不增加耗电量的情况下提高性能。英特尔估计,8瓦的Haswell单元有望集成整个GT3 GPU,不过没有给出产品版本方面的具体内容。英特尔展示了两种不同应用的运行情况:Unigine Heaven,这是合成图形基准测试,以及Bethesda’s Skyrim,这是对图形要求颇高的一款PC角色扮演游戏。Haswell在运行这两项测试时性能均比Ivy Bridge提高一倍,提供了流畅得多的视觉体验。
以前,英特尔在为最新的编程接口添加软件支持方面动作很晚。Haswell改变了这种局面,它实施了所有的最新标准:面向Windows 7和Windows 8的DirectX 11.1、面向GPU计算的OpenCL 1.2以及OpenGL 4.0。英特尔在驱动程序支持方面一向做得很好,提供了Windows驱动程序和Linux驱动程序。
虽然Haswell的3D图形引擎比之前英特尔在这方面的工作大有改进,但是台式机用户可能仍想要高端的独立显卡,以获得最佳的PC游戏性能。但是Haswell的图形核心有望使极薄的超极本成为还不错的游戏平台,而新的GPU为用户在基于Haswell的平板电脑上玩现代PC游戏提供了可能。
视频引擎
Ivy Bridge推出了QuickSync视频模块,这种是内置在GPU中的功能固定的专用视频单元。制造功能固定的视频引擎能够大大提升视频编码和解码的性能。但缺点是,它不是可编程的,所以如果出现了某种热门的新HD编解码器,视频引擎就处理不了。考虑到视频编解码器相当标准化,这不太可能。
不过,英特尔的确为Haswell视频引擎添加了额外的编解码器支持。运动JPEG(MJPEG)对视频会议而言很重要。SVC即可扩展视频编解码器在移动环境下很有用;在这种环境下,视连接速度而定,视频质量可能有所变化,所以视频质量可以从容扩展。即使网络带宽下降,用户们仍会看到良好的帧速率,而不会出现帧抖动或帧丢失。另外还增添了对4K视频的支持,支持即将上市的新一代超高清面板。
结论:更大的芯片、更好的性能、更低的功耗
Haswell会比Ivy Bridge更占用芯片空间;换句话说,这对英特尔来说每个处理器的成本更高,因为它无法在一块圆晶片上制造一样多的Haswell处理器。不过,Haswell的模块性多少缓解了这个问题;模块性让英特尔得以制造许多不同的Haswell产品,以尺寸较小的版本针对耗电量较低的小众市场。更棒的是,Haswell为英特尔的下一代14nm制造工艺作好了充分准备。
与Ivy Bridge相比,对主处理器所作的性能方面的调整大多数是渐进的。在一样的时钟频率下,用户可能会看到性能提升幅度达到10%。电源效率和图形性能有了大幅提升。电源效率的改进将使笔记本电脑终于有望像超极本那样电池续航时间长达一整天,而GPU改进意味着移动用户外出时也能享受相当爽的游戏体验。
Haswell有望成为历史上对英特尔的收入影响最大的一款处理器。新处理器的模块性和电源效率能带来一大批产品,市面上可能会出现外观尺寸迥异的Haswell产品。用户将成为受益者,因为在移动电脑和台式机方面有更多的选择,而性能有所提升,电池续航时间有所延长。