论文部分内容阅读
摘 要: 本文从CPU融合的发展历史,融合技术现有的硬件架构和与之相适应的软件应用等几方面进行分析来说明现存融合技术各自的特点及其未来的发展方向,并大胆预测了未来CPU的演化进程及其可能带来的未来计算领域格局的变化。
关键词: 整合 融合 CPU 架构 SOC
说到计算机硬件的整合,目前最火热的应该就是处理器的整合。而简单的整合,并不能满足生产商和用户的需求。于是,就出现了“融合”,虽然只有一个字之差,却可能对未来IT的发展会产生深远的,甚至是变革性的影响。
首先,让我们来回顾一下历史。2006 年AMD首先提出了“融聚”的概念。这一概念的核心是将CPU与GPU通过某种技术进行整合,以提升性能和应用。但第一个做成这件事的是INTEL的Clarkdale,虽然它仅仅是将32nm工艺的Core与45nm的NORTH BRIDGE通过特有总线进行连接,两颗Die并存于一块基片上,以取得近距总线所带来的性能提升。但这种整合却是CPU在融合之路上迈出的第一步,而INTEL凭借它成功地占领了市场。另一个提出了融合概念的是NVIDIA。由于没有X86授权,因此NVIDIA的融合是将自家的GPU与ARM架构的处理器进行融合。其代表作品就是Tegra。
2011年1月18日英特尔发布了第二代智能酷睿处理器产品Sandy Bridge。它的重大意义在于将CPU和GPU真正融合,因为CPU的Core核心和显示核心都采用32nm工艺制造,并封装在一颗Die中。同时第一次加入了AVX指令集,使得视频处理效能有效增强。
至此,可以说业内已经普遍认同了CPU与GPU融合的理念,并各自展开了行动。
接下来,让我们一起从硬件层面来看一下它们各自对融合的理解和实现。第一个是INTEL的Sandy Bridge,从平台结构图上看,会发现此时INTEL就已经非常重视GPU在处理器中的地位。而作为本身数据处理效率就已经非常出色的酷睿处理器,需要如此重视图形处理能力,可见市场需求的迫切。因此INTEL的对策就是将GPU集成到CPU 的内部,并通过添加新的指令集来满足这种需求。
第二个当然是AMD的Fusion架构, 其APU是由一颗标准CPU和一颗标准的支持DX11的GPU组成,这看似平淡无奇,甚至有点类似Sandy bridge。但是如果我们仔细观察,就会发现Fusion构架与Sandy bridge构架之间本质性的不同,那就是Fusion通过crossbar直接将GPU和CPU连接在MC上。GPU通过crossbar直接使用CPU的MC。这不仅节约了在GPU体系中较为占用晶体管资源的内存管理机制,而且大幅改变了GPU对本地显存的操作方式。同时随着GPU对MC的直连,GPU对本地显存的使用不再需要传统的集成,或者通过带宽有限而且本来就拥挤不堪的PCIE总线/北桥绕路访问主存。Fusion内部的GPU只需要在需要的时候直接使用CPU的MC单元,即可直接访问本地主存并完成对应的操作。人们一直梦寐以求的显卡直接内存操作,终于在Fusion上得到了应用。
相对于INTEL、AMD这些X86的CPU厂商。NVIDIA的思考可能更另类一些,NVIDIA选择了逆向融合技术,即把ARM 11 架构的CPU单元挂在GPU强大的显存控制器上。这在内存位宽上来说是有优势的。庆幸的是INTEL和AMD也似乎意识到了这一点,并提出了相关的概念。至于会如何发展还得看实物。
既然融合已有实物,那么我们应该再来看一下各类应用对这些融合架构的支持。首先,INTEL架构是现在来说获得支持最多的。原因在于INTEL的融合架构并没有对整个Die中的CORE架构做出更大的调整,但弱点也很明显,就是INTEL在GPU上的弱势地位如果未来还没有改变的话,形势就会变得很严峻。而对于AMD 的Fusion架构来说,不得不提的是OpenCL开放性编程环境。OpenCL (Open Computing Language,开放计算语言) 是一个为异构平台编写程序的框架,此异构平台可由CPU,GPU或其他类型的处理器组成。虽然有着完全开放的标准来保证高效的融合处理器编程,但目前我们依然看到很多问题。原因是OpenCL开放的编程环境,需要各家厂商针对自有硬件的编译器,而AMD在放弃Brook 之后暂时没有合适的编译器提出,所以纵然有OpenCL提供大环境,但是AMD依然没有获得较为广泛的厂商支持。另外,OpenCL只是个API,它不对硬件提出要求,硬厂商无法看到对其优化所能带来的任何性能提升,所以也没有支持欲望。最后是NVIDIA的架构,其核心计算框架就是CUDA,并且现在已有较多支持,效果也比较显著,但是由于CUDA是一种封闭的架构,应用厂家必须重新为CUDA改写很大部分代码才能充分利用GPU所带来的性能提升,工作量是很大的。另外一点,就是CUDA的前景,这对应用开发商来说是有极大风险的。
我们分别了解了三家厂商,它们不约而同地都将未来的融合架构处理器指向了超轻薄、超低功耗新概念笔记型电脑,并且将现有的更多的功能芯片集成进核心。这在某种意义上来说已经不是CPU了,而是智能SOC。这种趋势在我看来,是必然的。因为随着硬件制程工艺提升,使得各大生产商能够将以前完成特定功能的独立芯片集成到单一芯片中。同时,这也使他们能够更好地扩大市场,降低成本,提升利润,增加市场竞争力。而对用户来说,可以花更少的钱,得到更高性价比的产品,这是非常有吸引力的。
另外,据国外研究机构iSuppli根据2010年的最终数据预测,由于移动个人电脑市场的需求强劲的增长,2015年全球平板电脑出货量有望达到2.423亿台,是2010年销售量的12倍。与2010年的1740万相比2015年媒体平板电脑出货量预计将增长到超过2.02亿台。而PC平板电脑或全PC功能平板电脑的出货量将会增加到3930万台。如果说硬件生产商现在手中握有融合后的智能SOC,那他就可以同时占领PC、PAD、MID、SmartPhone等所有这些需要智能处理器的市场,而不必再将盘中的美食分予他人。
因此,可以预测的是在未来5年内计算(机)核心将从CPU转向更智能的SOC,并且这种局面还会持续10-15年。
关键词: 整合 融合 CPU 架构 SOC
说到计算机硬件的整合,目前最火热的应该就是处理器的整合。而简单的整合,并不能满足生产商和用户的需求。于是,就出现了“融合”,虽然只有一个字之差,却可能对未来IT的发展会产生深远的,甚至是变革性的影响。
首先,让我们来回顾一下历史。2006 年AMD首先提出了“融聚”的概念。这一概念的核心是将CPU与GPU通过某种技术进行整合,以提升性能和应用。但第一个做成这件事的是INTEL的Clarkdale,虽然它仅仅是将32nm工艺的Core与45nm的NORTH BRIDGE通过特有总线进行连接,两颗Die并存于一块基片上,以取得近距总线所带来的性能提升。但这种整合却是CPU在融合之路上迈出的第一步,而INTEL凭借它成功地占领了市场。另一个提出了融合概念的是NVIDIA。由于没有X86授权,因此NVIDIA的融合是将自家的GPU与ARM架构的处理器进行融合。其代表作品就是Tegra。
2011年1月18日英特尔发布了第二代智能酷睿处理器产品Sandy Bridge。它的重大意义在于将CPU和GPU真正融合,因为CPU的Core核心和显示核心都采用32nm工艺制造,并封装在一颗Die中。同时第一次加入了AVX指令集,使得视频处理效能有效增强。
至此,可以说业内已经普遍认同了CPU与GPU融合的理念,并各自展开了行动。
接下来,让我们一起从硬件层面来看一下它们各自对融合的理解和实现。第一个是INTEL的Sandy Bridge,从平台结构图上看,会发现此时INTEL就已经非常重视GPU在处理器中的地位。而作为本身数据处理效率就已经非常出色的酷睿处理器,需要如此重视图形处理能力,可见市场需求的迫切。因此INTEL的对策就是将GPU集成到CPU 的内部,并通过添加新的指令集来满足这种需求。
第二个当然是AMD的Fusion架构, 其APU是由一颗标准CPU和一颗标准的支持DX11的GPU组成,这看似平淡无奇,甚至有点类似Sandy bridge。但是如果我们仔细观察,就会发现Fusion构架与Sandy bridge构架之间本质性的不同,那就是Fusion通过crossbar直接将GPU和CPU连接在MC上。GPU通过crossbar直接使用CPU的MC。这不仅节约了在GPU体系中较为占用晶体管资源的内存管理机制,而且大幅改变了GPU对本地显存的操作方式。同时随着GPU对MC的直连,GPU对本地显存的使用不再需要传统的集成,或者通过带宽有限而且本来就拥挤不堪的PCIE总线/北桥绕路访问主存。Fusion内部的GPU只需要在需要的时候直接使用CPU的MC单元,即可直接访问本地主存并完成对应的操作。人们一直梦寐以求的显卡直接内存操作,终于在Fusion上得到了应用。
相对于INTEL、AMD这些X86的CPU厂商。NVIDIA的思考可能更另类一些,NVIDIA选择了逆向融合技术,即把ARM 11 架构的CPU单元挂在GPU强大的显存控制器上。这在内存位宽上来说是有优势的。庆幸的是INTEL和AMD也似乎意识到了这一点,并提出了相关的概念。至于会如何发展还得看实物。
既然融合已有实物,那么我们应该再来看一下各类应用对这些融合架构的支持。首先,INTEL架构是现在来说获得支持最多的。原因在于INTEL的融合架构并没有对整个Die中的CORE架构做出更大的调整,但弱点也很明显,就是INTEL在GPU上的弱势地位如果未来还没有改变的话,形势就会变得很严峻。而对于AMD 的Fusion架构来说,不得不提的是OpenCL开放性编程环境。OpenCL (Open Computing Language,开放计算语言) 是一个为异构平台编写程序的框架,此异构平台可由CPU,GPU或其他类型的处理器组成。虽然有着完全开放的标准来保证高效的融合处理器编程,但目前我们依然看到很多问题。原因是OpenCL开放的编程环境,需要各家厂商针对自有硬件的编译器,而AMD在放弃Brook 之后暂时没有合适的编译器提出,所以纵然有OpenCL提供大环境,但是AMD依然没有获得较为广泛的厂商支持。另外,OpenCL只是个API,它不对硬件提出要求,硬厂商无法看到对其优化所能带来的任何性能提升,所以也没有支持欲望。最后是NVIDIA的架构,其核心计算框架就是CUDA,并且现在已有较多支持,效果也比较显著,但是由于CUDA是一种封闭的架构,应用厂家必须重新为CUDA改写很大部分代码才能充分利用GPU所带来的性能提升,工作量是很大的。另外一点,就是CUDA的前景,这对应用开发商来说是有极大风险的。
我们分别了解了三家厂商,它们不约而同地都将未来的融合架构处理器指向了超轻薄、超低功耗新概念笔记型电脑,并且将现有的更多的功能芯片集成进核心。这在某种意义上来说已经不是CPU了,而是智能SOC。这种趋势在我看来,是必然的。因为随着硬件制程工艺提升,使得各大生产商能够将以前完成特定功能的独立芯片集成到单一芯片中。同时,这也使他们能够更好地扩大市场,降低成本,提升利润,增加市场竞争力。而对用户来说,可以花更少的钱,得到更高性价比的产品,这是非常有吸引力的。
另外,据国外研究机构iSuppli根据2010年的最终数据预测,由于移动个人电脑市场的需求强劲的增长,2015年全球平板电脑出货量有望达到2.423亿台,是2010年销售量的12倍。与2010年的1740万相比2015年媒体平板电脑出货量预计将增长到超过2.02亿台。而PC平板电脑或全PC功能平板电脑的出货量将会增加到3930万台。如果说硬件生产商现在手中握有融合后的智能SOC,那他就可以同时占领PC、PAD、MID、SmartPhone等所有这些需要智能处理器的市场,而不必再将盘中的美食分予他人。
因此,可以预测的是在未来5年内计算(机)核心将从CPU转向更智能的SOC,并且这种局面还会持续10-15年。