论文部分内容阅读
什么是评价电脑的关键指标?CPU、内存、硬盘、显示卡,这些简单罗列在产品包装上的信息勾勒出电脑的基本水平。但是,今天一项新的指标出现了,它将有机会改变电脑配置和心能格局。
内存对于计算机来说始终是一种稀缺资源,上到大型计算机、高性能计算机,小到智能手机、可穿戴设备。数十年前业已成型的冯·诺依曼计算机架构,确立了计算和存储两者间的关系。更具体一些,负责实质计算的CPU中ALU单元只会从固定的位置(寄存器)获取数据,计算结果也只会存在固定位置,而CPU的控制单元(CU)根据指令不断地将数据放入或取出,完成了整个计算的过程。实际情况略复杂一些,CU所读写的数据还包括了地址信息,这样它才知道数据从何出来或向何处去。和同样起到缓冲作用、但以减低接口压力的Buffer不同,Cache是加速内存数据存取,经过Cache一级一级的映射和预取,内存逐渐接近并匹配千倍于其速度的ALU,计算的瓶颈随之打破。在整个映射过程中,内存中数据的地址,并未因映射而改变。
计算机系统中,最常见的内、外存储结构。
快慢设备的衔接
对于计算机来说,高速和低俗设备之间,对获取数据方面的摩擦一直没有停止过,解决这种数据冲突的方式也在革新。
以速度最快的ALU为例,与之进行数据交换的寄存器有着相同速度的寄存器,除去在相邻周期里循环存取的时间周期不算,两者实际上是同频同步工作的。寄存器有着动辄数GHz的运行速度,只能集成在离ALU最近的地方,但代价是成本高昂、容量以字节为单位精打细算,这就是为什么如AVX 2.0中的256位指令/数据寄存器,英特尔更壕一些,直接放入256位长,而AMD抠门些,旗舰的Ryzen 7 1800X只有128位寄存器,256位数据需要两个周期读入和写出,性能折损极大。当然,处理器厂商们早已注意到这个问题,n年前就大肆引入Cache结构作为从寄存器到内存的梯级缓冲,用数量和逐渐提高的速度解决计算单元从内存获取数据的性能落差。L1、L2、L3 Cache容量通常为数十KB、数百KB和数MB,对应容量提升一个级别,速度也降低一个级别,以匹配慢速的GB级别内存。为了保证速度,Cache通常会采用SRAM(静态随机内存)制成,而内存虽然用了DRAM速度低了不少,但当年正是DRAM的出现,让配有64KB DRAM的PC有机会诞生,要知道同容量的SRAM当时价格超过2500美元,而第一台PC的不过1999美元。
类似的情况也出现在“存储”设备上,虽然以硬盘(HDD)为代表的存储设备已经是外设“矬子里面的将军”,但是它和PC系统之间的性能落差仍然很大,其性能包括了带宽和响应延迟等两个维度的速度。于是另一种缓存,Buffer出现了。别看中文都是“缓存”,但是在计算机词汇中,Cache和Buffer是两个不同世界的速度,相比多采用SRAM的Cache,Buffer多使用廉价的DRAM以缓解I/O接口两侧的速度不匹配,最常见的情形是Buffer容量作为HDD的重要参数标识产品档次。无论是哪种缓冲,都能在响应时间和带宽上同时匹配两端性能,两端都认为对方迁就了自己的性能水准,而没有察觉到缓冲的加入,此现象就叫透明。
容量与性能的分歧
经过多级缓冲,DRAM的速度已经远远落后于CPU,但即便如此,它仍远远高于主流的存储设备。更具体点说,单通道DDR4-2400内存带宽已近20GB/s、延迟为30ns左右,而容量已突破10TB的HDD,对应的性能水准只略微增长到150MB/s~200MB/s带宽,延迟则停留在3~4ms(接口)+7~8ms(平均寻道)的10年前水平,明显不能满足当下电脑系统的需求。于是这才有了近几年最有效的升级已经从增加内存变为了更换HDD为SSD。SSD综合性能较HDD已经有了质的飞跃,主流产品接口带宽突破1GB/s水平、延迟下降到μs量级,但与之伴随的就是10倍的价格差异。
无论是容量还是性能,对使用体验的影响都是显而易见的。在预算有限的前提下,考虑到时间可以换取性能而容量不行,更多数消费者都倾向于容量更大而非性能更高,这也就是为何仍有超过85%的台式电脑选择HDD作为唯一存储设备的原因。但凡预算宽裕一些,或者性能的需求稍占上风,双硬盘就成为更为理想的搭配。现实是很残酷的,艰难的预算增加,并不能带来如一的性能体验,频繁使用的数据固然可以手动放置到SSD中,但是相对较小的容量被占满后,越是大量的数据,越会深刻体会到“慢”的熬人,小容量SSD对此无能为力。
能够弥合电脑与HDD性能落差、解决SSD与HDD容量落差的Optane来了。
外形與如今主流的NVMe M.2 2280 SSD模块极为相像,但是Optane Memory更为简洁,表面芯片数量很少。
从硬盘到傲腾
虽然中文都是一样的“内存”,但是Memory、RAM和DRAM却是截然不同的含义。冯·诺依曼架构的内存是Memory,数据能通过地址索引存储在上面就可以,而RAM则是落地到计算设备(计算机、手机等)的Memory技术类型,具体的产品是DRAM,对应关系如同外存光盘DVD一样。即便已经是相对最便宜的类型,DRAM价格仍然高达10美元/GB,是主流外存设备HDD有着100倍以上的价格差距。更致命的是,DRAM是典型的易失性半导体,简单的说就是断电就会丢失数据,不仅需要在通电状态下不断刷新数据(通过读操作完成),而且每次加电,都需要重新从外存加载数据,说白了就是从更慢的硬盘上读取系统、应用和数据,这就是为什么硬盘的速度对系统启动时间的影响最大最直接了。 与内存相对应,外存是容量更大,同时不以内存地址映射表形式保存数据的存储器,HDD(硬盘)可谓是我们最熟悉,并且仍然是最主流的外存产品,其存储逻辑已变为分区表索引扇区的形式,SSD在存储逻辑上与HDD并无差异,而物理介质上的存储逻辑有别,另外就是相应延迟更短、数据持续传输带宽更高。
对计算机系统来说,它并不“认得”外存,OS(操作系统)起到了很好的“翻译”作用,将系统发出的内存访问需求转化为硬盘读写操作,DOS(Disk Operating System,磁盘操作系统)就是这么来的。计算机并不知道数据真实存储在何处,而OS知道,当要访问的数据不再内存中时,OS会临时将其从外存中调入,这个速度只有直接访问就能获得数据的千分之一,在获得该数据前计算机只能等待,所有时间被浪费。经过优化的OS或驱动程序,可以预判计算机将要求的下一个数据,从而提前将其装入内存。至于为什么OS不把所有数据都装入内存,以减少数据等待时间,这还不都是容量不够、价格高企造成的么。使用高性能SSD能解决从外存获取数据速度的问题么?
新的思路
NAND是闪存(Flash)中最主要的类别,具有读写耐久性随制程提升下降、性能随制程提升下降等固有特性,特别是为了在有限的晶圆(成本)上获得更大容量,制程和单元结构升级一直没有停止过,如今NAND已经进入10nm时代、TLC渐成主流,反观其耐久性艰难维持在2000次左右(TLC刚出现时,耐久性下降到500次),延迟和介质性能改进缓慢。
2015年,英特尔正式发布了名为3D XPoint的全新非易失性存储技术,这就是横空出世的Optane傲腾;与英特尔合作生产相关产品的美光,则将其命名为QuantX。3D XPoint或者说Optane与NAND/NOR等Flash完全不同,而存储/读写原理更接近于内存,延迟、耐擦写性、介质速度等几个关键指标也优于NAND几个数量级,未来发展潜力巨大,英特尔的目标是用其扩大仅有5%左右的SSD市场份额。技术已经发布一年多的3D Xpoint,终于以Optane(傲腾)的产品形式落地了。非易失性和性能方面优势,使其可在计算机系统中扮演多种甚至是任何存储角色:内存、存储和缓存,分别对应Optane DIMM、Optane SSD和Optane Memory等3类产品,从而改变整个计算机存储发展进程。目前后两类产品已经上市。
姑且不论面向企业级高性能存储市场的Optane SSD和暂未推出的Optane DIMM,先来说说解决PC外存性能不足问题的第三种产品形式Optane Memory。
Optane Memory是夹在内存(DRAM)和外存(HDD)中的“劝架人”,又是OS处理数据访问需求的好帮手,它情商颇高,三头都喜欢它,内存和外存都愿意与它交换数据,OS对它管理外存的能力非常放心。而在Optane Memory诞生之前,内存总是埋怨外存“太肉”,而外存则抱怨内存对它呼来唤去都快累死了,OS经常里外不是人。
3D XPoint的性能定位
Optane Memory凭什么让大家都喜欢它?这还要从它的身世说起。今天的计算机,特别是PC核心的性能瓶颈已经从CPU、内存转移到外存,更高频率的CPU、更大容量的内存,只能解决有限的数据问题,一旦牵扯到更大量的数据,就必须和慢吞吞的外存打交道。甚至在越来越多的实际应用中,更大的内存拖累了PC的性能体验。举例来说,当OS获知有4GB内存时,它会调用较少的2GB数据,100MB/s读写性能的HDD需用时20s;而当内存增至8GB,OS会允许调入6GB数据,需读取数据60s,PC等待时间变长、体验变差。好在这只是个比方,现实中的OS没有那么不济,可以在数据部分调入内存后就允许CPU还是工作,极端情况下已经处理的数据回写与读取数据的冲突才更令人挠头。
Optane Memory恰好出现在这个位置。它本质上是一种缓存,在英特尔RST(Rapid Storage Technology)驱动帮助下,它可以协助OS将HDD上的频繁访问数据预读到自己内部,等待OS随时发号将数据装入内存的施令。Optane Memory采用了全新的存储介质,是比NAND更为理想的缓存材料,响应时间为ns级别、速度是GB/s级别,均比高性能SSD高一个数量级以上,以接近甚至达到DRAM的水平,可谓一呼即应。目前Optane Memory模块已推出16GB和32GB两种容量,能够轻易做到两倍于主流电脑DRAM容量的水平,再也不用担心512MB或1GB的TurboMemory模块上所出现的数据量不够内存用的问题,对DRAM来说,由它所供给的数据可谓源源不绝。同时,Optane Memory与DRAM的特性相同,支持多任务并行操作,在不断喂饱DRAM的同时还能从HDD继续读取数據或将数据写回HDD,这个能力可谓是HDD技术发展几十年来梦寐以求的能力。对HDD来说,Optane Memory既迁就了它的低速、“同意”用时间换总量,又挡住了严重影响用户体验和小数据频繁读写,对延长寿命、降低功耗颇有贡献。
与DRAM和NAND存储技术相比,3D XPoint可谓兼得两者之优势。
新性能指标
如今,对寻求性能的PC来说,配备SSD是相当不错的选择,但与此同时,容量和价格的问题困扰着它完全取代HDD,在预算允许的情况下,SSD+HDD的双盘方案成为可能。然而,从整体PC配备的硬盘情况来看,双盘的比例恰恰最低,从金钱到管理,成本问题是最大的障碍;使用集成NAND模块为HDD加速的SSHD产品配备率也不高,产品选择少、性能提升有限等因素是主要制约。对更多用户来说,单盘仍然是主要选择,而其中单HDD携容量和成本优势占据85%的份额。 Optane Memory很有可能改变这一市场格局,甚至成为实质拉动存储性能上新台阶的推手。在SSD价格不跌反涨的当下,Optane Memory可以让数TB容量的数据达到甚至超越SSD的性能表现,同价格情况下,SSD只有100GB量级的容量。回到刚才留下的包袱,除了局促的容量难以令SSD发挥出最佳性能,SSD在计算机系统逻辑中仍旧是外存设备,其上存储的是文件,但是Optane Memory在RST的帮助下,已经将HDD上的文件整理为内存直接可用的数据块,在系统调用时直接减少了数据转换的过程,对数据的访问响应更快至DRAM水平。
更具意义的部分在于,Optane Memory性能是如此出色,竟还被OS当作硬盘使用。当开启虚拟内存功能时,内存镜像要暂存至HDD,这个功能虽缓解了系统内存不足问题,但HDD太慢,动辄过GB虚拟内存页的读写交换过程严重影响体验。Optane Memory在此时变身为影子HDD,带来数十倍的速度提升,变相增加了系统内存容量,形成了类似Xeon平台+Optane SSD才能做到的内存池(Memory Pool)特性,即DRAM+Optane Memory(虚拟内存形式)。这也可以解释为何在实际测试中,4GB内存+16GB Optane Memory的系統比配备8GB内存的HDD系统性能更为出色了。
如今,主流PC的内存容量不过8GB~16GB,数百元的Optane Memory就能带来数千元内存才能做到的32GB~64GB内存性能和应用能力,更有本职工作——加速HDD,真可谓以小博大的经典呀。
和高端SSD相比,Optane Memory没有性能方面的优势可言,但是,不要忘了,它可以让HDD达到红线的水平,单HDD只有它1/10的性能。
Optane带来哪些改变
对PC来说,Optane三种不同形态的产品中,傲腾内存(Optane Memory)是来帮助“后进”分子的。在如今的PC中,存储“当仁不让”地拖了整个系统的后腿,曾经最有效的性能提升手段,已经从增加内存变为添加SSD。但是在预算有限的情况下,系统所添加的SSD并不能满足现实需要,比性能更凸显的矛盾是容量。
包括此前英特尔自己推出的TurboMemory在内,双硬盘(独立)或者混合硬盘(加速)方案,都是面向预算充足的中高端系统,而面对预算有限的PC提供有效的加速方案方面就略显不足。Optane Memory首先改变了产品定位,从再加速转变为加速。另外,不得不提的是,混合加速方案的软件平台Windows ReadyDrive早已非常成熟,但是对应的硬件方案,无论是TurboMemory+HDD还是SSD+HDD都已经被实质淘汰,即实际使用率或配置率极低,容量不足以及SSD如何在中高端笔记本电脑上普及,是前者推出市场的主要原因,而SSD性能本身的短板,则是混合方案失败的主因。
Optane Memory延续了混合硬盘的解决方案,而且从性能指标上并不比NVMe接口的高端SSD更出色,它凭什么改变PC的生态呢?在很多测试中,Optane Memory被拿来与消费级高端的三星960Pro/Evo、英特尔600p/6000p进行比较。以定位相对较低的英特尔600p系列产品为例,容量仅有16GB/32GB的Optane Memory读性能超过最小容量的600p,而I/O能力也在其之上,甚至读I/O性能大幅领先。同时,英特尔公布的读/写延迟时间也显示,Optane Memory仅在?s量级,而3D NAND普遍在10ms水平,相差千倍!当然,更高端的Pro 6000p以及三星的960Pro/Evo在I/O性能方面的提升更为显著,实际测试也反映出它们完全在另一个境界。
低延迟的特性特别有利于提升用户使用体验,而高I/O能力更是弥补了HDD的不足,反而是数据传输速度成为相对次要的参数。
从成本投入角度来看,三星960全系起始容量已在256GB水平,价格近千元;能够达到379元/44美元价位的SSD,只能是性能半残的三星XP941级别产品,而容量最小的600p比32GB Optane Memory价格更高、性能略低,选择起来似乎并不难。
性能助推器
在开始分析Optane Memory的性能分析之前,首先要给大家看的是其性能表现。以上测试的平台为Core i5-7600、4GB、希捷ST500DM002 500GB机械硬盘。其中这可HDD转速为7200r/min、16MB缓存、单碟500GB,125MB/s的平均读写速度,可真算不上高水准。
HDD性能真的就如此了,125MB/s不高不低的指标。
然而在实际测试中,无论Optane Memory容量是16GB还是32GB,整个系统的磁盘性能全部以Optane Memory的性能水平示人!完全没有1xxMB/s的赢弱表现。而且在测试中,Optane Memory的测试成绩极为接近甚至略高于标称水平,这是在以往的HDD或SSD测试中从未有过的,通常受数据压缩和接口延迟影响,几个主流的硬盘仿真测试软件出来的成绩,会低于标称水平5%~10%,都是正常的,标称性能往往只有在IOMeter这样的纯粹测试中达到,看来英特尔的数据标称还是非常保守的。
是否负担HDD性能优化工作,对Optane Memory的读写速度层面的性能影响几乎没有,相对显著的影响在4K文件的读性能上,性能分水岭则是读取文件的容量:超过Optane Memory的容量,则读性能被拉低,而不超过则几乎无影响。究其原因,与Optane Memory的缓存机理有密切关系,而同理,写性能也会受到相应的影响,但目前无论是测试软件还是主流应用,都罕有一次性写入数据量超过16GB的,至少你得有16GB以上很多的内存,才有一次性写入这么多数据的可能。至于性能被拉低的程度,则和被读取数据的类型、数据块大小密切相关,总体来说越细碎负面影响越大,因为这样更会将HDD的I/O的瓶颈凸显。在此前SSD使用ReadyDrive加速HDD的测试中,存储系统的读写性能也被拉升,但是提升幅度远不能达到SSD原本的性能表现,SSD本身I/O性能缺陷和延迟较大的不足,在这样的方案中被放大——OS大量细碎缓冲读写模式,正好“发挥”了SSD的4K能力、耐久性的劣势。 另一组开启或关闭Optane Memory系统缓冲功能的测试对普通用戶更有意义,它代表着装备Optane Memory所能带来的直接体验改善。
关于起动时间,无论是应用软件还是系统,用户对其起动时间的感受最为直接,Optane Memory的加入可谓将HDD瞬间变为SSD,而且一次性读写数十GB数据的应用非常罕见,Optane Memory所带来的几乎就是全盘(HDD)无缝的性能优化,这一效果是SSD+HDD的双盘模式无法企及的。
目前,Optane Memory 16GB版本价格已出,为379元,32GB版本价格预计不会超过700元。单就对PC性能的帮助来说,动辄数百GB甚至数TB的SSD级别存储,可谓从地飞到天,使早已脱离摩尔定路的存储回归正轨。
何种姿态示人
不过,落回现实市场,消费者对新的Optane Memory接受起来可不是朝夕之事。即便是被市场快速认可的SSD,也初期产品I/O性能不足、与DOM(Disk On Module)/存储卡性能差距不大,以及可靠性被质疑许久,直到SATA 3Gb/s接口之后,性能被更大限度地发挥出来,质疑的声音才淡去。无论是外观、接口还是特性,Optane Memory太像SSD(M.2模块)了,这虽然便于其普及,但没有卓然于高端SSD的表现,极易陷入与高端SSD比性能、与低端SSD比价格的尴尬境地。而在消费者更为敏感的容量方面,固然可以用加速HDD的方式证明其价值,也有着成熟的RST驱动及ReadyDrive接口,但是绝大多数配备双硬盘的用户仍在使用两个独立盘的模式,你在说加速的时候人家再说容量、简单和价格。
如今,英特尔为Optane Memory定下的市场策路是暂时仅支持200系列芯片组+七代酷睿。购置这样配置的用户目前定属高端,预算充裕,最少120GB SSD的配置,16GB/32GB的Optane Memory很难打动他们,而真正期待Optane Memory特性的升级用户却只能眼巴巴看着。当时间把200系列芯片组打到入门级,Optane Memory的机会能更多些。
当然,很快Optane Memory将进一步拓展其应用领域,除了台式电脑及其延伸的一体电脑、NUC等细分领域产品外,笔记本电脑及老平台也将有可能收益与它。不过话说回来,这还是要看英特尔推进Optane Memory有多迫切,这是个市场问题。
内存对于计算机来说始终是一种稀缺资源,上到大型计算机、高性能计算机,小到智能手机、可穿戴设备。数十年前业已成型的冯·诺依曼计算机架构,确立了计算和存储两者间的关系。更具体一些,负责实质计算的CPU中ALU单元只会从固定的位置(寄存器)获取数据,计算结果也只会存在固定位置,而CPU的控制单元(CU)根据指令不断地将数据放入或取出,完成了整个计算的过程。实际情况略复杂一些,CU所读写的数据还包括了地址信息,这样它才知道数据从何出来或向何处去。和同样起到缓冲作用、但以减低接口压力的Buffer不同,Cache是加速内存数据存取,经过Cache一级一级的映射和预取,内存逐渐接近并匹配千倍于其速度的ALU,计算的瓶颈随之打破。在整个映射过程中,内存中数据的地址,并未因映射而改变。
计算机系统中,最常见的内、外存储结构。
快慢设备的衔接
对于计算机来说,高速和低俗设备之间,对获取数据方面的摩擦一直没有停止过,解决这种数据冲突的方式也在革新。
以速度最快的ALU为例,与之进行数据交换的寄存器有着相同速度的寄存器,除去在相邻周期里循环存取的时间周期不算,两者实际上是同频同步工作的。寄存器有着动辄数GHz的运行速度,只能集成在离ALU最近的地方,但代价是成本高昂、容量以字节为单位精打细算,这就是为什么如AVX 2.0中的256位指令/数据寄存器,英特尔更壕一些,直接放入256位长,而AMD抠门些,旗舰的Ryzen 7 1800X只有128位寄存器,256位数据需要两个周期读入和写出,性能折损极大。当然,处理器厂商们早已注意到这个问题,n年前就大肆引入Cache结构作为从寄存器到内存的梯级缓冲,用数量和逐渐提高的速度解决计算单元从内存获取数据的性能落差。L1、L2、L3 Cache容量通常为数十KB、数百KB和数MB,对应容量提升一个级别,速度也降低一个级别,以匹配慢速的GB级别内存。为了保证速度,Cache通常会采用SRAM(静态随机内存)制成,而内存虽然用了DRAM速度低了不少,但当年正是DRAM的出现,让配有64KB DRAM的PC有机会诞生,要知道同容量的SRAM当时价格超过2500美元,而第一台PC的不过1999美元。
类似的情况也出现在“存储”设备上,虽然以硬盘(HDD)为代表的存储设备已经是外设“矬子里面的将军”,但是它和PC系统之间的性能落差仍然很大,其性能包括了带宽和响应延迟等两个维度的速度。于是另一种缓存,Buffer出现了。别看中文都是“缓存”,但是在计算机词汇中,Cache和Buffer是两个不同世界的速度,相比多采用SRAM的Cache,Buffer多使用廉价的DRAM以缓解I/O接口两侧的速度不匹配,最常见的情形是Buffer容量作为HDD的重要参数标识产品档次。无论是哪种缓冲,都能在响应时间和带宽上同时匹配两端性能,两端都认为对方迁就了自己的性能水准,而没有察觉到缓冲的加入,此现象就叫透明。
容量与性能的分歧
经过多级缓冲,DRAM的速度已经远远落后于CPU,但即便如此,它仍远远高于主流的存储设备。更具体点说,单通道DDR4-2400内存带宽已近20GB/s、延迟为30ns左右,而容量已突破10TB的HDD,对应的性能水准只略微增长到150MB/s~200MB/s带宽,延迟则停留在3~4ms(接口)+7~8ms(平均寻道)的10年前水平,明显不能满足当下电脑系统的需求。于是这才有了近几年最有效的升级已经从增加内存变为了更换HDD为SSD。SSD综合性能较HDD已经有了质的飞跃,主流产品接口带宽突破1GB/s水平、延迟下降到μs量级,但与之伴随的就是10倍的价格差异。
无论是容量还是性能,对使用体验的影响都是显而易见的。在预算有限的前提下,考虑到时间可以换取性能而容量不行,更多数消费者都倾向于容量更大而非性能更高,这也就是为何仍有超过85%的台式电脑选择HDD作为唯一存储设备的原因。但凡预算宽裕一些,或者性能的需求稍占上风,双硬盘就成为更为理想的搭配。现实是很残酷的,艰难的预算增加,并不能带来如一的性能体验,频繁使用的数据固然可以手动放置到SSD中,但是相对较小的容量被占满后,越是大量的数据,越会深刻体会到“慢”的熬人,小容量SSD对此无能为力。
能够弥合电脑与HDD性能落差、解决SSD与HDD容量落差的Optane来了。
外形與如今主流的NVMe M.2 2280 SSD模块极为相像,但是Optane Memory更为简洁,表面芯片数量很少。
从硬盘到傲腾
虽然中文都是一样的“内存”,但是Memory、RAM和DRAM却是截然不同的含义。冯·诺依曼架构的内存是Memory,数据能通过地址索引存储在上面就可以,而RAM则是落地到计算设备(计算机、手机等)的Memory技术类型,具体的产品是DRAM,对应关系如同外存光盘DVD一样。即便已经是相对最便宜的类型,DRAM价格仍然高达10美元/GB,是主流外存设备HDD有着100倍以上的价格差距。更致命的是,DRAM是典型的易失性半导体,简单的说就是断电就会丢失数据,不仅需要在通电状态下不断刷新数据(通过读操作完成),而且每次加电,都需要重新从外存加载数据,说白了就是从更慢的硬盘上读取系统、应用和数据,这就是为什么硬盘的速度对系统启动时间的影响最大最直接了。 与内存相对应,外存是容量更大,同时不以内存地址映射表形式保存数据的存储器,HDD(硬盘)可谓是我们最熟悉,并且仍然是最主流的外存产品,其存储逻辑已变为分区表索引扇区的形式,SSD在存储逻辑上与HDD并无差异,而物理介质上的存储逻辑有别,另外就是相应延迟更短、数据持续传输带宽更高。
对计算机系统来说,它并不“认得”外存,OS(操作系统)起到了很好的“翻译”作用,将系统发出的内存访问需求转化为硬盘读写操作,DOS(Disk Operating System,磁盘操作系统)就是这么来的。计算机并不知道数据真实存储在何处,而OS知道,当要访问的数据不再内存中时,OS会临时将其从外存中调入,这个速度只有直接访问就能获得数据的千分之一,在获得该数据前计算机只能等待,所有时间被浪费。经过优化的OS或驱动程序,可以预判计算机将要求的下一个数据,从而提前将其装入内存。至于为什么OS不把所有数据都装入内存,以减少数据等待时间,这还不都是容量不够、价格高企造成的么。使用高性能SSD能解决从外存获取数据速度的问题么?
新的思路
NAND是闪存(Flash)中最主要的类别,具有读写耐久性随制程提升下降、性能随制程提升下降等固有特性,特别是为了在有限的晶圆(成本)上获得更大容量,制程和单元结构升级一直没有停止过,如今NAND已经进入10nm时代、TLC渐成主流,反观其耐久性艰难维持在2000次左右(TLC刚出现时,耐久性下降到500次),延迟和介质性能改进缓慢。
2015年,英特尔正式发布了名为3D XPoint的全新非易失性存储技术,这就是横空出世的Optane傲腾;与英特尔合作生产相关产品的美光,则将其命名为QuantX。3D XPoint或者说Optane与NAND/NOR等Flash完全不同,而存储/读写原理更接近于内存,延迟、耐擦写性、介质速度等几个关键指标也优于NAND几个数量级,未来发展潜力巨大,英特尔的目标是用其扩大仅有5%左右的SSD市场份额。技术已经发布一年多的3D Xpoint,终于以Optane(傲腾)的产品形式落地了。非易失性和性能方面优势,使其可在计算机系统中扮演多种甚至是任何存储角色:内存、存储和缓存,分别对应Optane DIMM、Optane SSD和Optane Memory等3类产品,从而改变整个计算机存储发展进程。目前后两类产品已经上市。
姑且不论面向企业级高性能存储市场的Optane SSD和暂未推出的Optane DIMM,先来说说解决PC外存性能不足问题的第三种产品形式Optane Memory。
Optane Memory是夹在内存(DRAM)和外存(HDD)中的“劝架人”,又是OS处理数据访问需求的好帮手,它情商颇高,三头都喜欢它,内存和外存都愿意与它交换数据,OS对它管理外存的能力非常放心。而在Optane Memory诞生之前,内存总是埋怨外存“太肉”,而外存则抱怨内存对它呼来唤去都快累死了,OS经常里外不是人。
3D XPoint的性能定位
Optane Memory凭什么让大家都喜欢它?这还要从它的身世说起。今天的计算机,特别是PC核心的性能瓶颈已经从CPU、内存转移到外存,更高频率的CPU、更大容量的内存,只能解决有限的数据问题,一旦牵扯到更大量的数据,就必须和慢吞吞的外存打交道。甚至在越来越多的实际应用中,更大的内存拖累了PC的性能体验。举例来说,当OS获知有4GB内存时,它会调用较少的2GB数据,100MB/s读写性能的HDD需用时20s;而当内存增至8GB,OS会允许调入6GB数据,需读取数据60s,PC等待时间变长、体验变差。好在这只是个比方,现实中的OS没有那么不济,可以在数据部分调入内存后就允许CPU还是工作,极端情况下已经处理的数据回写与读取数据的冲突才更令人挠头。
Optane Memory恰好出现在这个位置。它本质上是一种缓存,在英特尔RST(Rapid Storage Technology)驱动帮助下,它可以协助OS将HDD上的频繁访问数据预读到自己内部,等待OS随时发号将数据装入内存的施令。Optane Memory采用了全新的存储介质,是比NAND更为理想的缓存材料,响应时间为ns级别、速度是GB/s级别,均比高性能SSD高一个数量级以上,以接近甚至达到DRAM的水平,可谓一呼即应。目前Optane Memory模块已推出16GB和32GB两种容量,能够轻易做到两倍于主流电脑DRAM容量的水平,再也不用担心512MB或1GB的TurboMemory模块上所出现的数据量不够内存用的问题,对DRAM来说,由它所供给的数据可谓源源不绝。同时,Optane Memory与DRAM的特性相同,支持多任务并行操作,在不断喂饱DRAM的同时还能从HDD继续读取数據或将数据写回HDD,这个能力可谓是HDD技术发展几十年来梦寐以求的能力。对HDD来说,Optane Memory既迁就了它的低速、“同意”用时间换总量,又挡住了严重影响用户体验和小数据频繁读写,对延长寿命、降低功耗颇有贡献。
与DRAM和NAND存储技术相比,3D XPoint可谓兼得两者之优势。
新性能指标
如今,对寻求性能的PC来说,配备SSD是相当不错的选择,但与此同时,容量和价格的问题困扰着它完全取代HDD,在预算允许的情况下,SSD+HDD的双盘方案成为可能。然而,从整体PC配备的硬盘情况来看,双盘的比例恰恰最低,从金钱到管理,成本问题是最大的障碍;使用集成NAND模块为HDD加速的SSHD产品配备率也不高,产品选择少、性能提升有限等因素是主要制约。对更多用户来说,单盘仍然是主要选择,而其中单HDD携容量和成本优势占据85%的份额。 Optane Memory很有可能改变这一市场格局,甚至成为实质拉动存储性能上新台阶的推手。在SSD价格不跌反涨的当下,Optane Memory可以让数TB容量的数据达到甚至超越SSD的性能表现,同价格情况下,SSD只有100GB量级的容量。回到刚才留下的包袱,除了局促的容量难以令SSD发挥出最佳性能,SSD在计算机系统逻辑中仍旧是外存设备,其上存储的是文件,但是Optane Memory在RST的帮助下,已经将HDD上的文件整理为内存直接可用的数据块,在系统调用时直接减少了数据转换的过程,对数据的访问响应更快至DRAM水平。
更具意义的部分在于,Optane Memory性能是如此出色,竟还被OS当作硬盘使用。当开启虚拟内存功能时,内存镜像要暂存至HDD,这个功能虽缓解了系统内存不足问题,但HDD太慢,动辄过GB虚拟内存页的读写交换过程严重影响体验。Optane Memory在此时变身为影子HDD,带来数十倍的速度提升,变相增加了系统内存容量,形成了类似Xeon平台+Optane SSD才能做到的内存池(Memory Pool)特性,即DRAM+Optane Memory(虚拟内存形式)。这也可以解释为何在实际测试中,4GB内存+16GB Optane Memory的系統比配备8GB内存的HDD系统性能更为出色了。
如今,主流PC的内存容量不过8GB~16GB,数百元的Optane Memory就能带来数千元内存才能做到的32GB~64GB内存性能和应用能力,更有本职工作——加速HDD,真可谓以小博大的经典呀。
和高端SSD相比,Optane Memory没有性能方面的优势可言,但是,不要忘了,它可以让HDD达到红线的水平,单HDD只有它1/10的性能。
Optane带来哪些改变
对PC来说,Optane三种不同形态的产品中,傲腾内存(Optane Memory)是来帮助“后进”分子的。在如今的PC中,存储“当仁不让”地拖了整个系统的后腿,曾经最有效的性能提升手段,已经从增加内存变为添加SSD。但是在预算有限的情况下,系统所添加的SSD并不能满足现实需要,比性能更凸显的矛盾是容量。
包括此前英特尔自己推出的TurboMemory在内,双硬盘(独立)或者混合硬盘(加速)方案,都是面向预算充足的中高端系统,而面对预算有限的PC提供有效的加速方案方面就略显不足。Optane Memory首先改变了产品定位,从再加速转变为加速。另外,不得不提的是,混合加速方案的软件平台Windows ReadyDrive早已非常成熟,但是对应的硬件方案,无论是TurboMemory+HDD还是SSD+HDD都已经被实质淘汰,即实际使用率或配置率极低,容量不足以及SSD如何在中高端笔记本电脑上普及,是前者推出市场的主要原因,而SSD性能本身的短板,则是混合方案失败的主因。
Optane Memory延续了混合硬盘的解决方案,而且从性能指标上并不比NVMe接口的高端SSD更出色,它凭什么改变PC的生态呢?在很多测试中,Optane Memory被拿来与消费级高端的三星960Pro/Evo、英特尔600p/6000p进行比较。以定位相对较低的英特尔600p系列产品为例,容量仅有16GB/32GB的Optane Memory读性能超过最小容量的600p,而I/O能力也在其之上,甚至读I/O性能大幅领先。同时,英特尔公布的读/写延迟时间也显示,Optane Memory仅在?s量级,而3D NAND普遍在10ms水平,相差千倍!当然,更高端的Pro 6000p以及三星的960Pro/Evo在I/O性能方面的提升更为显著,实际测试也反映出它们完全在另一个境界。
低延迟的特性特别有利于提升用户使用体验,而高I/O能力更是弥补了HDD的不足,反而是数据传输速度成为相对次要的参数。
从成本投入角度来看,三星960全系起始容量已在256GB水平,价格近千元;能够达到379元/44美元价位的SSD,只能是性能半残的三星XP941级别产品,而容量最小的600p比32GB Optane Memory价格更高、性能略低,选择起来似乎并不难。
性能助推器
在开始分析Optane Memory的性能分析之前,首先要给大家看的是其性能表现。以上测试的平台为Core i5-7600、4GB、希捷ST500DM002 500GB机械硬盘。其中这可HDD转速为7200r/min、16MB缓存、单碟500GB,125MB/s的平均读写速度,可真算不上高水准。
HDD性能真的就如此了,125MB/s不高不低的指标。
然而在实际测试中,无论Optane Memory容量是16GB还是32GB,整个系统的磁盘性能全部以Optane Memory的性能水平示人!完全没有1xxMB/s的赢弱表现。而且在测试中,Optane Memory的测试成绩极为接近甚至略高于标称水平,这是在以往的HDD或SSD测试中从未有过的,通常受数据压缩和接口延迟影响,几个主流的硬盘仿真测试软件出来的成绩,会低于标称水平5%~10%,都是正常的,标称性能往往只有在IOMeter这样的纯粹测试中达到,看来英特尔的数据标称还是非常保守的。
是否负担HDD性能优化工作,对Optane Memory的读写速度层面的性能影响几乎没有,相对显著的影响在4K文件的读性能上,性能分水岭则是读取文件的容量:超过Optane Memory的容量,则读性能被拉低,而不超过则几乎无影响。究其原因,与Optane Memory的缓存机理有密切关系,而同理,写性能也会受到相应的影响,但目前无论是测试软件还是主流应用,都罕有一次性写入数据量超过16GB的,至少你得有16GB以上很多的内存,才有一次性写入这么多数据的可能。至于性能被拉低的程度,则和被读取数据的类型、数据块大小密切相关,总体来说越细碎负面影响越大,因为这样更会将HDD的I/O的瓶颈凸显。在此前SSD使用ReadyDrive加速HDD的测试中,存储系统的读写性能也被拉升,但是提升幅度远不能达到SSD原本的性能表现,SSD本身I/O性能缺陷和延迟较大的不足,在这样的方案中被放大——OS大量细碎缓冲读写模式,正好“发挥”了SSD的4K能力、耐久性的劣势。 另一组开启或关闭Optane Memory系统缓冲功能的测试对普通用戶更有意义,它代表着装备Optane Memory所能带来的直接体验改善。
关于起动时间,无论是应用软件还是系统,用户对其起动时间的感受最为直接,Optane Memory的加入可谓将HDD瞬间变为SSD,而且一次性读写数十GB数据的应用非常罕见,Optane Memory所带来的几乎就是全盘(HDD)无缝的性能优化,这一效果是SSD+HDD的双盘模式无法企及的。
目前,Optane Memory 16GB版本价格已出,为379元,32GB版本价格预计不会超过700元。单就对PC性能的帮助来说,动辄数百GB甚至数TB的SSD级别存储,可谓从地飞到天,使早已脱离摩尔定路的存储回归正轨。
何种姿态示人
不过,落回现实市场,消费者对新的Optane Memory接受起来可不是朝夕之事。即便是被市场快速认可的SSD,也初期产品I/O性能不足、与DOM(Disk On Module)/存储卡性能差距不大,以及可靠性被质疑许久,直到SATA 3Gb/s接口之后,性能被更大限度地发挥出来,质疑的声音才淡去。无论是外观、接口还是特性,Optane Memory太像SSD(M.2模块)了,这虽然便于其普及,但没有卓然于高端SSD的表现,极易陷入与高端SSD比性能、与低端SSD比价格的尴尬境地。而在消费者更为敏感的容量方面,固然可以用加速HDD的方式证明其价值,也有着成熟的RST驱动及ReadyDrive接口,但是绝大多数配备双硬盘的用户仍在使用两个独立盘的模式,你在说加速的时候人家再说容量、简单和价格。
如今,英特尔为Optane Memory定下的市场策路是暂时仅支持200系列芯片组+七代酷睿。购置这样配置的用户目前定属高端,预算充裕,最少120GB SSD的配置,16GB/32GB的Optane Memory很难打动他们,而真正期待Optane Memory特性的升级用户却只能眼巴巴看着。当时间把200系列芯片组打到入门级,Optane Memory的机会能更多些。
当然,很快Optane Memory将进一步拓展其应用领域,除了台式电脑及其延伸的一体电脑、NUC等细分领域产品外,笔记本电脑及老平台也将有可能收益与它。不过话说回来,这还是要看英特尔推进Optane Memory有多迫切,这是个市场问题。