明天今天的内在选择

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:xurizhaoyangdongshen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读


法定继承人DDR5


  要说到DDR5,必须首先明确一个问题。它与目前主流的DDR5显存,即GDDR5并不是一回事虽有一定的血缘关系,但关系已经相当远了。DDR5是从目前主流的DDR4发展而来。但GDDR5却是从DDR3进化而来的。此外还有另一个发展路线上的低功耗产品LPDDR5。虽然技术有些关联,但主要面向移动、集成市场(图1)。



  DDR5的规范其实在2016年就开始规划,也就是说DDR4刚刚开始走上正轨。厂商们就在筹划下一代内存了。这一规范主要由三星提出、美光参与。具体性能方面。规划中的DDR5从3.2GHz等效频率起跳,主流频率会达到6.4GHz,容量则为16GB起跳电压1.1V。而从目前公布的一些DDR5颗粒来看。似乎厂商有意直接出货6.4GHz左右的高频产品(图2),与目前已经进入主流价位的DDR 43×00内存拉开档次。
  微小的进步和出色的兼容性
  总体来看,DDR5其实就是等效频率翻倍的DDR4,而其翻倍的方式也和之前的DDR2、3、4一样,利用了每个时钟周期内电平的不同来触发(图3),在保持基础频率的基础上可以获得数倍的等效运行频率。这样渐进式的发展兼容性更好,是DDR5成为下一代标准的主要原因之,。
  当然,DDR5已经需要在一个时钟周期内触发惊人的32次动作,所以需要非常精确地测量时钟脉冲和电平,并且维持非常高的运行速度和稳定性。为此DDR5颗粒和内存条中也增加了一些新模块、电路和算法,比如用来修正时钟相位、减小时钟误差的相位插值/旋转器(PhaseRotator),用来调整均分时间的延迟锁定回路(Delay-Locked Loop),以及注入锁相振荡器(Injection LockedOscillator)和前向反馈均衡电路(FFE)等。很显然,虽然DDR5没有进行架构大改,但更复杂的电路及元件以及早期的良品率问题还是会明显提升成本,所以预计其上市价格将大幅高于DDR4内存。
  DDR6紧随其后
  作为DDR5最有可能的后继产品,DDR6也已经初露端倪。这次的先行厂商是SK海力士,其开发的DDR6内存预期速率12GHz,即DDR6-12000,正好又是主流DDR5速率的两倍。DDR6还可能采用更高的每周期数据传输能力等技术进一步提升性能,使其成为一次性能跨越较大的内存升级。根据媒体采访透露出的信息,SK海力士预计DDR6将在5年~6年内发展完成,正式进入主流市场。
  需要注意的是,SK海力士在研的“后DDR5”产品仍为技术概念,目前成型的主要有两种,其中一种是延续现有的数据传输规范,另一种则是将DRAM与CPU等片上系统的处理技术结合。很显然,后一种其实和目前HBM内存的使用方式很类似。
  GDDR显存与LPDDR内存
  在内存规范中,很多人经常会被GDDR和LPDDR搞糊涂。其实GDDR基本与同代DDR没有什么关系,而是有着自己的发展路线,只是有时会有一些交叉。比如GDDR2是DDR2内存的优化版本,而GDDR3内存基本上是原封不动照搬了DDR3颗粒,后续的GDDR4、GDDR5(图4)、GDDR5X都是进一步优化的GDDR3(DDR3)。GDDR6(图5)的变化更大一些,每个芯片配置了两条x8/x16通道,而GDDR5仅有一条通道,此外电压下降到1.35V,耗能降低了35%左右,因此获得了和HBM甚至HBM2显存一较高下的能力。同时其针脚数量也比GDDR5X有所减少,生产、使用都更方便。
  当然与DDR内存颗粒相比,GDDR还是有一些改变的,比如修改了外部接口,使用更高的集成度,可以用更少的颗粒提供足够的带宽,但在一定程度上牺牲了延迟,R寸也略大一些。GDDR还会尽量提升运行效率,获得更高的等效频率,同时降低功耗。当然这些能力除了对架构、工艺的修改外,也是因为显存利润较高,所以厂商也更倾向于在GDDR颗粒的制造中投入更新的技术、制程。
  至于LPDDR系列,则是(Low Power Double DataRate SDRAM,低功耗DDR内存)的简称,它们的技术、架构与同代DDR内存基本相同(图6),但使用非常低的电压,如LPDDR4使用1.1V电压,使其功耗大幅降低。
  需要注意的是,LPDDR和低电压DDR内存如DDR3L也不一样,其电压更低,功耗也更小,因此平台定位就完全不同,前者主要用于手机、平板电脑等设备,而后者则和普通DDR内存的应用方式基本相同,主要用于笔记本电脑,也大量用于台式电脑中。

蛰伏的HBM


  除了DDR5,目前已经很成熟的内存技术还有HBM(高带宽内存),它在高端显卡上的表现也很抢眼。为什么来自CPU大厂AMD,并且早就宣布过要进军PC内存市场的HBM,却迟迟没有真正的动作?它又会不会借着第二代产品HBM2的成熟和本次PC内存的升级进入内存市场呢?要理解这些问题,咱们先得了解HBM内存及其特点。
  顾名思义,HBM内存最大的特色就是位宽特别高,可以在较低频率下实现很高的数据传输率。如果以道路进行比喻,那么DDR内存就是通过不斷提高车速来换取更快的数据运输速度,而HBM则是把路尽量拓宽,通过并行更多的车辆来换取更大的数据运输量。HBM的封装构造也和DDR内存完全不同,是多层颗粒层叠放置(图7),所以体积可以做得很小(图8)。   日日M内存的问题也恰恰在于它的工作方式,由于带宽非常大但频率相对较低,所以与核心连接的线路更复杂、对延迟的敏感度更高。要用HBM做PC内存的话,内存插槽与处理器接口间就必须尽量接近,而且线路非常复杂密集;而如果像GPU一样把它直接做在CPU封装内(图9),就要放弃内存插槽,这都需要对主板结构进行大改。
  另外的问题来自CPU,HBM能用于GPU的原因是现在GPU显存位宽都很大,主流产品192bit起步,使用HBM内存的Vega 64(010)和Titan V更达到了2048bit和3072bit。但目前主流CPU的内存控制器只能使用128 bit双通道,根本没法充分利用HBM的高带宽,甚至还限制了可用的内存容量。
  HBM仍需机会
  DDR内存终归是一种改进式产品,速率一直加倍、加倍就需要越来越精细地控制、识别时钟电平,稍微有一点波动就会造成频率不稳,长远看来必然难以为继,这也是为什么在“后DDR5”时代的内存开发中,出现了类似HBM的与CPU集成的方案。
  笔者认为,HBM或者更新架构的内存无疑是未来的发展方向,不过这需要处理器、主板甚至整个PC架构大改,因此仍需要等待机会。
  目前看来,HBM的机会主要有两种,一是遇到了非常强力的推手,例如支持HBM,同时具有划时代意义的处理器及相应平台。但在目前已知的下一代产品如第三代锐龙、Sunny Cove中,都没有确认会支持HBM,而且它们似乎都没有采用超高内存带宽的设计,应该也无法发挥HBM的能力。
  二是DDR模式的渐改方式出现问题,过高的频率和过于精细的分频让DDR内存变得非常不稳定,或者需要添加更多额外的元件、电路,使得成本无限制地上涨。此时HBM或其他类型的内存,以及新的PC架构就会占有成本优势,进而成为新的主流。
  目前的内存选购策略
  从目前的情况可以判断,两种淘汰DDR内存的机会最近都不会出现,所以DDR内存的生命还是相当长的。对准备装机的用户来说,并未商品化的DDR5也无需等待,从平台支持和自身的成本来看,它大规模取代DDR4内存估计要到2022年了,近期公布的处理器如锐龙300和X570芯片组即使开始支持DDR5,也必然会保留对DDR4的支持,且主流主板肯定也会有DDR4插槽的。


彻底革命新的内在方式


  作为目前电脑中的主力通信协议,PCle的历史已经很长了,即使是PCle 3.0也有着近10年的历史。这在电脑设备标准中是比较少见的长寿了。而从PCle 1.0到3.0,虽然每一代的带宽只提升为两倍(图11),但实际体验却有很大的区别。
  以显卡为例,一代PCle可以很好地支持早期GPU,PCle 2.0时代可以让显卡配合处理器进行异构运算,PCle3.0足够的带宽让双显卡并联完全可以不用桥接器。另外比如现在流行的高速M.2 SSD,也只有在单通道达到1GB/s的PCle 3.0时代才能拉开与SATA接口的差距。



  那么PCle 4.0呢?现在的RTX 2080 Ti已经把PCle 3.0×8的带宽吃得干干净净,实际带宽需求在PCle 3.0×10左右(图12)。所以不用等下一代显卡,现在RTX 2080 Ti SLI(8+8)或者RTX未来的顶级Titan型号就已经需要更大的带宽了。此外使用PCle 4.0的SSD性能也非常强,传输速度已经可达到6.4GB/s级别(PCle 4.0×4),而且已经有用于服务器中的产品(图13)。
  然而这些传统应用并不是PCle 4.0带来的最大改变。其实我们计算一下就会发现,PCle4.0×16插槽的带宽已经达到了32GB/s,接近双通道DDR4 2400内存(38.4GB/s)的带宽,完全是内存级别的传输速度。而在其上运行的3D Xpoint产品则拥有极强的潜力,目前已经可以提供远超NAND,更接近内存的传输速度、相应延迟等指标(图14)。



  在目前已经大量使用PCle 4.0的服務器领域,英特尔已经推出了一种新形态的存储架构,即将基于3D Xpoint技术的产品作为内存与SSD存储之间的缓冲(图15),可以大幅降低相应元件的压力,同时大幅提升系统整体性能。甚至可以说英特尔最新的服务器芯片,在性能方面的提升已经开始依赖于这种新架构了(图16)。



  那么,与PCle 4.0搭配的3D Xpoint技术到底有何神奇之处,用于服务器的3D Xpoint产品与现在大家熟悉的用来加速硬盘的傲腾有什么不同呢?
  改变格局的搭档 3D XPoint
  3D XPoint是一种由英特尔与美光(Micron)共同开发的存储技术,虽然其具体原理和结构都仍在保密中,不过基本可以确定,它是一种使用电阻来标记数据状态的新型存储技术。由于电阻这种特性无需电荷来维持,所以其存储的数据是“非易失性”的,也就是除非进行主动擦除,否则断电之后数据仍然存在。   3D XPoint的结构非常简单,由选择器与内存单元共同构成,它们位于线路的交叉位置,可以通过电流快速改变内存单元的电阻,或者读取其中的电阻状态。这一过程中电阻的改变是非常快的,而同时所需的电压也比目前的NAND擦写更低。
  3D Xpoint不仅读写快,而且因为始终是以bit为基本单位进行操作,在擦写时的系统消耗更是远低于NAND,因为后者在这一过程中需要进行至少Kbit为单位的数据块操作,而不能直接以bit為单位进行擦写。所以3D Xpoint设备并不需要NAND设备使用的垃圾回收机制等设计,可以极大地简化控制器与固件结构,同时也可以提供更高的性能与更低的功耗。



  3D XpointfAPCle 4.0应用模式
  目前的NAND SSD速度为500MB/s~6GB/s,而高速系统内存的带宽则为48GB/s(双通道DDR4 3000),两者间差了一个数量级;NAND颗粒的延迟为100微秒,DRAM只有十几纳秒,相差了4个数量级左右。目前的3D Xpoint性能恰好在其中间,且更加靠近内存,例如其延迟比NAND小1000倍,与DRAM一样为纳秒级别,如果作为系统内存,可以获得与DRAM类似的性能,同时还具有关机数据保留、低功耗等很多与现在完全不同的应用能力(图17)。



  借助PCle 4.0×16通道的力量,3D Xpoint设备带宽则可达到32GB/s,同样更接近系统内存带宽。我们这里讨论的带宽还只是单条插槽的能力,如使用类似内存的多插槽多通道技术,3D Xpoint存储带宽还可倍增(图18)。而即使是目前在消费级平台上更常见的NVMe接口3D Xpoint设备,在同样常用的NVMe(PCle4.0)×4通道支持下,带宽也可达到6.4GB/s~8GB/s,很适合作为内存与SATA SSD、HD之间的存储缓冲设备。
  其他存储技术和PC形态
  除了3D Xpoint之外,相变存储器、高速磁存储设备等新形态存储产品,在高带宽的PCle 4.0或者未来的PCle 5.0时代,也都可能成为改变电脑内存架构的新力量。而其高性能的基础,除了更先进的高速存储技术之外,新的PCle总线、插槽提供的高带宽也是必不可少的。
  当然,也许要到PCle 5.0甚至更遥远的PCle 6.0时代,新形态存储技术和应用模式才能真正成熟。不过在PCle 4.0时代,以3D Xpoint为首的新存储技术至少已经揭开了PC架构发展的契机,未来的PC形态,就在这一刻悄悄地开始改变了。
其他文献
首先可以使用HotShut软件,下载解包后直接运行HotShut1.2.exe文件即可,程序图标便会常驻系统托盘。当需要进行某项电源功能控制时,右键单击该图标,然后选择相应的菜单命令即可:选择Shutdown关闭电脑,选择Restart重启电脑,选择Log Off/SignOut注销或切换账户,选择Hibernate休眠,选择Lock锁定电脑(图1)。  若感觉上述软件功能简单,还可使用另一个软件
期刊
AI画像——“真实”的不存在  我们只要打开浏览器登录https://thispersondoesnotexist.com,成功加载网页后就会看到一幅人物画像,可以看到这些人像非常的真实,而且每刷新一次会出现新的画像,他们就像是我们生活中的各个普通人物(图1)。AI画像背后——认识StyleGAN算法  那么这些人像是怎么生成的呢?该网站明确表示,是基于GAN的StyleGAN算法生成的。GAN是
期刊
最终幻想:纷争(DISSIDIA FINAL FANTASY NT)  《最终幻想》系列在2019年动作不少,先是发布了《最终幻想15》的最新剧情关,接着PS4版的《最终幻想:纷争》也移植到了PC平台。  “纷争”系列其实是《最终幻想》的一个衍生品牌,主打的是历代《最终幻想》人物大乱斗。这个系列在PSP上推出过两部作品,此后又在PS4上得到延续,现在这个系列第一次来到了PC平台。对于《最终幻想》的
期刊
如今很多朋友在闲暇之余都喜欢用智能手机看电影,不过当Android手机播放某些包含中文音频的电影时,听到的却是英文,且找不到切换音频的选项。此外,使用手机看电影,我们总希望即点即看,不希望等待。接下来,笔者就给大家介绍一下如何解决上述问题。音频切换 任君选择  下载的电影有时会包含普通话、英语或粤语等多条音轨,而默认播放的音频不一定是自己所需要的。令人遗憾的是,无论Android手机自带的视频播放
期刊
首先,选择‘公式”选项卡,点击“名称管理器”,在弹出的窗口中点击“新建”,“名称”处输入“sjrtmp”,“弓}用位置”处输入“=OFFSET($B$1:$I$1,CELL("row")-1,)”(图2)。  接着,选定一空白单元格,根据需要插入一个图表,如带数据点的折线图。右击图表,选择“选择数据”,在弹出窗口的左侧点击“添加”,“系列名称”处输入“源数据”,“系列值”处输入“=sheet2!s
期刊
熟悉的味道  如今联想旗下的拯救者被细分为Y7000和Y7000P,后者改用金属材质的顶盖、挑高式转轴设计、144Hz刷新率的电竞屏幕,并优化了键盘和内部散热模块,售价较Y7000略高一点。而炫龙耀7000的外观大家应该也非常熟悉,机械革命Z2 Air和神舟战神Z7M-KP5GZ就都是它的“姊妹”,三款产品都选用了同方国际的公模,而炫龙耀7000则是其中同配置下售价最低的,唯一的不足就是取消了触控
期刊
透视效果的立体2019  一般来说,给平面的文字添加上立体特效,会大大增加视觉冲击力。在实际制作之前,首先让我们看看本例的最终效果(图1)。  启动PowerPoint(本文以2016版为例),新建一个PPT文档。在“开始”选项卡中,点选“绘图”中的矩形图标,然后在文档空白处随意点击‘下,即可自动绘制出一个矩形(也可以按住Shift键不放,然后用鼠标手动绘制)。  调整好矩形的大小后,右击它,在弹
期刊
为什么无论其他品牌SSD是价格坚挺还是一溃干里,这些所谓的杂牌SSD总能在价格赛跑中取胜呢?答案当然就是更便宜的元件。例如我们曾经多次提到的NAND颗粒有所谓白片、黑片的说法(图1),将这些产品进行处理,例如降频之后,同样也是可以勉强使用的。此外随着前几代SSD接近使用寿命、升级周期,也有大量拆机片可用,甚至可提供一些性能仍在可用范围内的主控芯片。  无论使用拆机、降频、打磨的存储颗粒,还是从旧产
期刊
很多人都知道Android手机支持通话录音,但真正使用该功能的用户却很少。原因则多种多样,比如担心隐私通话时被不小心记录下来而存在泄露风险,或者每次录音都需要手动点一下太麻烦。实际上,如今手机的通话录音功能已經非常成熟,设置起来也非常方便。  通话录音功能大都集成在“通话→设置”中,以360手机为例,可以一键开启“通话自动录音”,而我们还可以自定义录音文件的保存路径(图1)。在自动录音对象选项中,
期刊
构思设计及组装基本图形  本实例是通过载有木块的小车来演示“惯性”概念的。即:第一步,向右运动的小车突然停下,车上的木块(做匀速直线运动)向前倒;第二步,突然向右拉动小车,小车上的木块(保持静止状态)向后倒。这两个PPT动画的制作方法是相同的,因此本文就以第一个动画为例来介绍。  运行户owerpoint(本文以2016版为例),新建一个名为“惯性.PPTX”的PPT文档,接着在“插入”选项卡中单
期刊