论文部分内容阅读
长期以来大家对ARM的印象应该是专注手持设备,很难在性能上与x86一较高下,从现有架构的角度来说确实如此,ARM A75的重排序缓冲条目、前端解码宽度、向量指令宽度、后端执行端口数量只能跟10年前的45nm Nehalem架构相比,远远不是现有Skylake的对手(Coffee Lake等不算新架构)。但这并不意味着ARM不能做高性能:还是从架构来看,ARM和x86都是取指、编譯、访存、执行、写回的流水线,级数也十分接近,这40年来CISC和RISC早已是互相学习借鉴得七七八八,当然,关键性的不同点依然存在,比如内存模型。
ARM现在的“弱”,症结并不是硬件和指令集,而是功耗——还停留在个位数功耗的ARM一旦放开限制,它的性能会随着规模的增大而有一个质的起飞,类似的情况在英特尔身上也发生过,当年血拼高频的NetBurst架构奔腾4失败后,英特尔以基于低功耗设计、为笔记本研发的Basias架构为基础,放开功耗限制,催生了初代和二代酷睿。结果就是性能爆发,功耗依然控制得当,一举重回正轨。而与之类似的骁龙1000也因此可能会成为一个新的开头,在20mm×15mm的封装下实现全功能SoC。
不过,ARM PC亟待解决的是编译效率的问题,即便是当下已有的骁龙835笔记本,在GeekBench里也只能跑单核不到900分(Core i5 8250U可以超过4000分),但在安卓手机上这颗SoC可以轻松跑过2000分,为什么会有这么明显的性能缩水?原因在于当下的ARM Windows PC本质上运行的是虚拟机,而异构指令集、同构操作系统的虚拟机,处理器性能需要达到目标机型3-5倍才能实现性能还原。当然,从整个系统的角度来看,UFS比不上NVMe、LPDDR比不上DDR,与此同时还没把显卡考虑进来……所以现有的方案很容易在性能体验和价格上被吐槽。而且ARM笔记本在研发、模具、功能设计上的成本都不便宜(而且一开始是产能低、摊销高),市场伊始也不能把基调定得太低,以后的最终成品的弹性会变得很小。但真正为PC而生的ARM SoC我觉得应该会是前途光明,不仅性能可期,而且5G极有机会普及到笔记本上,续航时间也会明显延长,再加上Windows系统先天的多任务特性,以及长期以来不断优化的快速响应机制……所以,至少在可预见的未来,轻薄本领域是一定会有好戏可看的。
ARM现在的“弱”,症结并不是硬件和指令集,而是功耗——还停留在个位数功耗的ARM一旦放开限制,它的性能会随着规模的增大而有一个质的起飞,类似的情况在英特尔身上也发生过,当年血拼高频的NetBurst架构奔腾4失败后,英特尔以基于低功耗设计、为笔记本研发的Basias架构为基础,放开功耗限制,催生了初代和二代酷睿。结果就是性能爆发,功耗依然控制得当,一举重回正轨。而与之类似的骁龙1000也因此可能会成为一个新的开头,在20mm×15mm的封装下实现全功能SoC。
不过,ARM PC亟待解决的是编译效率的问题,即便是当下已有的骁龙835笔记本,在GeekBench里也只能跑单核不到900分(Core i5 8250U可以超过4000分),但在安卓手机上这颗SoC可以轻松跑过2000分,为什么会有这么明显的性能缩水?原因在于当下的ARM Windows PC本质上运行的是虚拟机,而异构指令集、同构操作系统的虚拟机,处理器性能需要达到目标机型3-5倍才能实现性能还原。当然,从整个系统的角度来看,UFS比不上NVMe、LPDDR比不上DDR,与此同时还没把显卡考虑进来……所以现有的方案很容易在性能体验和价格上被吐槽。而且ARM笔记本在研发、模具、功能设计上的成本都不便宜(而且一开始是产能低、摊销高),市场伊始也不能把基调定得太低,以后的最终成品的弹性会变得很小。但真正为PC而生的ARM SoC我觉得应该会是前途光明,不仅性能可期,而且5G极有机会普及到笔记本上,续航时间也会明显延长,再加上Windows系统先天的多任务特性,以及长期以来不断优化的快速响应机制……所以,至少在可预见的未来,轻薄本领域是一定会有好戏可看的。