AI时代的计算“芯”法

来源 :微型计算机 | 被引量 : 0次 | 上传用户：Henkel_liu

【摘要】

：

【作者】

：

张平

【出处】

：

微型计算机

【发表日期】

：

2021年12期

【关键词】

：

英特尔处理器至强数据操作产品

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　2021年是英特尔的产品大年。年初，英特尔发布了全新的第十一代酷睿台式机处理器和第十一代酷睿H35系列处理器，将英特尔桌面和移动处理器的性能带到了一个新的高度。三四月份，英特尔又发布了第三代至强可扩展处理器IceLake全系列产品，在将处理器核心数量大幅度提升至40核的基础上，又加入了大量的全新技术特性。5月份，英特尔凭借第十一代酷睿H45系列处理器实现了对移动产品的全覆盖。在如此多、如此密集的产品发布背后，人们看到了一个在产品上锐意进取、在技术上不懈努力的英特尔。
　　对英特尔来说，产品的发布往往是万里长征才走完了一半，产品发布后对产品特性和应用的持续推广尤其是和实际市场、具体应用的结合也非常重要。这一点在英特尔第三代至强可扩展处理器上表现得特别明显。第三代至强可扩展处理器相比上代产品整体变化非常大，其核心微架构升级、工艺进化，因此带来了非常显著的性能、功能提升。
　　近期，英特尔公司市场营销集团副总裁兼中国区数据中心销售总经理陈葆立及三位英特尔数据中心资深技术专家针对第三代至强可扩展处理器的特性、优势以及应用案例进行了深度分享。根据英特尔的数据，第三代至强可扩展处理器相比上代产品在性能方面提升了46%，这里的提升是指平均数据，在诸如人工智能和网络计算等领域，由于新指令集的引入，其提升幅度更高。此外，新产品在安全特性、机密计算、整体带宽、平台功能方面都有显著改善。由于产品在功能和相关特性上变化巨大，因此在产品发布前后，英特尔还持续跟踪和接收用户反馈，并且和客户一起，根据新产品特性，在安全、人工智能和机密计算方面进行了结合实际应用场景的持续研发和不断更新。下面，本文和大家一起来分享这些新的信息。
　　安全第一：英特尔在软件防护和密码操作硬件加速方面的进展
　　在第三代至强可扩展处理器上，英特尔引入了两个新的特性，一个是英特尔软件防护扩展SGX，另一个则是英特尔密码操作硬件加速。先来看SGX技术，从历史来看，英特尔对产品的安全特性一直很重视，从第六代酷睿处理器开始，英特尔就引入了相关安全特性，当时称之为IntelSoftwareGuardExtension，也就是现在我们看到的在第三代至强可扩展处理器上加入的英特尔软件防护扩展SGX的“始祖”。值得一提的是，所谓“扩展”，并不是一个功能或者一个特性，而是指通过新扩展指令集的方式，方便软件开发者通过直接调用CPU指令來实现平台安全隔离技术，整体设计更为底层、高效和独特。SGX的作用也非常明白，那就是针对敏感数据提供独立于操作系统和硬件配置的增强安全防护。这个功能的应用场景是什么呢？举例来说，目前企业上云的趋势非常明显。企业在使用云计算时，数据传输到云是加密的、在云端的数据也是加密存储的，但是在云端计算的过程中，由于云端服务器要实现对数据的操作和处理，那么这个过程的数据可能就没有办法很好加密了。而SGX就是提供了可以把数据中心、云计算服务器中的指定内存区域的数据和当前的操作系统、硬件隔离开来的功能，实现敏感数据的安全处理。
　　由于数据隔离，云端数据的安全性就有了保障，服务器的操作系统和硬件在没有许可的情况下是不可能得到这些敏感数据的。从这个角度来看，英特尔SGX是一种基于硬件的可信执行环境，内存中的数据看起来依旧在内存中，但是隔离的特性使其成为当前系统的“飞地”，安全性就有了保证。英特尔宣称他们可以让CPU在内存中为单独的应用程序划分出单独的区域，由CPU专门对这块区域进行加密解密操作。在这种情况下，即使是操作系统、虚拟机管理程序这些高权限的软件或者攻击者、恶意访问者，都无法得到内存中加密后的数据。不仅如此，SGX保护的空间是可大可小的，最小4KB，最大1TB，基本上可以满足目前绝大部分软件的需求了。
　　在具体的客户方面，英特尔提到阿里云和腾讯云目前已经开始部署相关的技术并实现了可信计算。国外的用户比如德国的电子医保数据也采用这个功能，符合欧盟严格的GDPR安全规范，让用户的数据隐私得到了很好的保护。
　　接下来则是英特尔密码操作硬件加速。这个是一个比较好理解的概念，目前对很多敏感数据都采用密码加密处理，对密码的操作一般采用对称密码操作或者非对称密码操作，其中前者可以采用电子签名这种标准的算法来实现，但是无论如何，类似这样的密码操作都需要耗费CPU的算力，如果将这种标准算法实现硬件加速以后，就可以降低CPU的算力损耗，这是非常有意义的。
　　在具体实现方面，英特尔提到了三个方式。一是通过CPU指令集来实现AES加密的高速度、高效率，这个指令集在2010年的时候首次应用，被称为AES-NI，目前也在不断地加强中。二是英特尔在每一代CPU上都针对加密解密计算做一些微架构上的调整，使得整体性能不断提升。三则是软件优化，通过软件结合硬件的优化，能够带来密码硬件操作的提速。
　　英特尔还带来了一些有关密码硬件加速的案例。比如新的第三代至强可扩展处理器在计算OpenSSLRSA2048位的签名上，相比上一代CPU，单线程情况下有5.6倍的提升，在进行AES-GCM对称加密方式的情况下，相对上一代产品，单线程情况下有3.3倍的提升，这个提升幅度是相当可观的。在非对称加密解密方面，英特尔也提到了一些功能优化，比如借助AVX-512指令集实现相关计算加速，英特尔举例称第三代至强可扩展处理器通过VPMADD52指令，再通过多缓存并行操作的机制，在RSA2048这样一个电子签名的操作上实现比上一代CPU高达5.6倍的提升。在密码学的伽罗华域方面，英特尔采用VAES和VCLMultiply提升了性能。软件优化方面，英特尔实现了多缓存并行执行和函数级别的缝合技术，后者可以实现不同格式的加密计算的一次性处理，大大提高了计算效率。
　　AI无处不在：智算领先
　　在之前的介绍文章中，我们曾提到第三代至强可扩展处理器在AI计算方面做出了很大加强，其中一个重要的改进就是AVX-512，英特尔是目前业内唯一支持AVX-512指令集的厂商，另一个是AI加速有关的指令集。借助于这两个方面的加速和软件的优化，英特尔宣称新的第三代至强可扩展处理器相比上代产品提升了74%的AI计算性能，比竞争对手快了大约25倍，不过这样的数据应该是在比较极端的状态下实现的。此外，英特尔在软件上持续投入，比如英特尔在TensorFlow上优化了ResNet的性能，相较于默认发行版可以提升10倍。在Scikit-Learn上经过优化，相比非优化版本获得了100倍的性能提升。　　由于英特尔在AI计算上很好的优化，因此带来了非常领先的计算优势和具体应用场景的优势。在这一部分，英特尔给出了两个例子，一个是在数字娱乐方面的优化，比如目前人们在游戏中常见的捏脸技术，可以使玩家在游戏中获得非常出色的角色融入感。有关“捏脸”和相关应用，英特尔在这里做了一个非常好的尝试，那就是利用AI，通过用户上传人脸照片，自动和游戏内的3D模型耦合，这里利用到了第三代至强可扩展处理器的VNNI指令集，仅仅使用int8整数计算，就完成了2D人脸模型到3D游戏模型的转换，相比传统需要使用FP32的计算，第三代至强可扩展处理器和新的指令集带来了4.23倍的性能提升，同时技术和应用也非常简单。第二个例子是英特尔和阿里云一起针对自然语言进行优化，利用的也是第三代至强可扩展处理器的VNNIint8相关特性，实现了3倍的性能提升。
　　除了上述AI加速的内容外，英特尔在AI数据的安全方面也有很多独特的创新。比如借助第三代至强可扩展处理器的SGX技术配合AI计算，可以实现数据不用离开当前的机房就能够完成AI模型训练，这种技术被称为“联邦学习技术”。由于数据不用离开机房，因此在安全防护、数据控制方面更方便，因此受到了很多敏感数据用户的欢迎，比如金融企业。英特尔和银联就推出了名为AnalyticsZoo的新技术，此外英特尔还和平安科技进行合作，实现了基于英特尔SGX技术加持的云边协同的隐私计算实践方案，其特点也是在SGX的控制下，数据模型中包含的敏感信息不会被威胁或者窃取，即完成了工作、提高了效率，还加强了数据安全性，整体效果很不错。
　　机器学习和隐私保护：安全效率兩不误
　　在上文，我们介绍了一些安全和AI计算的相关内容。在这一部分，主要谈及个人隐私和机器学习有关的内容。目前全球各国对隐私保护都越来越严格，比如我国有《中华人民共和国个人信息保护法（草案）》，欧盟有GDPR，美国加州有CCPA等法律。这些隐私保护法律对个人隐私的获取、存储和使用都规定得越来越严格。具体到现在的AI计算来看的话，很多AI计算都离不开个人信息的收集和处理，比如人脸信息、医疗信息、位置信息和操作记录等。目前主要有三类数据需要被保护，一个是AI模型的训练数据，比如从千百万用户采集来的信息进行模型训练，这些信息是非常敏感的。二是AI模型数据，这些模型数据是通过机器学习、机器训练而来，其数据本质是千百万用户的行为，因此也需要保护，并且很多数据模型还涉及敏感信息，这就更加重要了。三是预测结果，比如AI模型根据数据给出的预测结果，具体到个人或者某个具体的群体的话，那也必须保护起来，不能被非法、无序使用。
　　在这种情况下，英特尔提出的解决方案是结合前文提到的SGX，联邦学习等功能来实现数据的管控和安全处理。与其他的隐私保护或者安全技术相比，不管是在安全性、性能和可用性方面，SGX都有明显的优势。SGX是一个硬件级的安全技术，安全性很好，同时计算性能也非常出色。易用性方面，SGX不会打破现有应用方式，也不会重新构建底层，更不会破坏数据和模型，整体迁移性、易用性都很出色。此外，SGX还提供远程认证等功能，可以实现参与方之间的远程互认证，这可以解决多方合作中的可信问题，助力联邦学习打破数据孤岛。
　　英特尔给出了一些具体案例，包括通过SGX技术、LibOS技术，以及AnalyticsZoo现有的API和实例给用户构建一个可信的大数据AI平台。其中最典型的就是和蚂蚁集团的隐私保护机器学习合作案例。蚂蚁集团的Occlum项目，是一个开源的LibOS项目，通过OcclumLibOS，应用程序可以不做任何更改，运行在SGX中。目前，Occlum支持的应用越来越多了，除了之前讲到的深度学习应用，一些大数据比如说Spark、Flink、Hadoop都可以无缝通过OcclumLibOS运行在SGX当中，从而带来了极高的易用性和安全性。
　　从英特尔本次会议给出的信息来看，未来计算的发展方向一定是和效率、安全高度相关。在效率方面，英特尔通过第三代至强可扩展处理器已经实现了计算能力的飞跃，在安全方面，通过SGX技术配合相关的AI计算、隐私保护等功能，英特尔也带来了目前业内最领先的安全管理技术之一，并且已经和多家企业合作落地，实现了技术和应用的结合。总的来说，第三代至强可扩展处理器在发布后仅仅数个月就带来了如此多改变业内应用模式的方案和应用案例，确实体现了英特尔在企业级市场上的统治力。

其他文献

效率、品质两手抓RTX显卡为AdobeSubstance Alchemist赋能

自从NVIDIA RTX Studio生态在CES展会上完整公布时，GeForce RTX显卡便有了新的身份，不再是单纯的游戏显卡。而RTX Studios生态也囊括了RTXGPU、NVIDIA Studio驱动以及NVIDIAStudio SDK，让NVIDIA GeForce RTX显卡在设计创作的道路上有着更出色的发挥。其中全新的RTX GPU配备了新的Tensor core，它可以加速AI

期刊

纹理材质设计师材料显卡功能

为颜值加分

在刚刚结束的2016全国“两会”上，虽然规定了委员和代表们不能携带自拍杆入会场，但对采访的记者并没有要求。于是我们可以看到很多记者通过一根自拍杆就能独立完成采访报道，可以说自拍杆一定程度上给我们的生活甚至是工作都带来了一定的便利性，而自拍杆的市场自然也是非常火爆。市场上很多自拍杆都是以低端为主，这些自拍杆大多都在10元到几十元不等，质量参差不齐，功能也非常单一。而最近摩米士推出的这款SELFIE

期刊

自拍这款蓝牙相机功能价格

新一代锐龙APU整机实战体验

7nm Zen2就是主要提升新一代“Renoir”APU技术解析　　虽然新一代APU由多款产品组成，但它们有一个最大的共同点就是采用Zen2架构处理器核心，同时从CPU核心、内存控制器、PCIe控制器到GPU显示核心全都采用7nm生产工艺打造。相对于上一代处理器架构，Zen2架构处理器核心的IPC（InstructionPerClock，CPU每时钟周期指令执行数）提升了15%，这主要得益于Zen

期刊

三星处理器新一代核心这款单元

So-Voioe V500

共点同轴是设计难度较大的扬声器技术，国内则只有索威专注于此。在公司成立20周年之际，索威基于同轴单元推出了一款限量版音箱V500，同时还添加了铝带式超高音单元，显得更不一般。　　完善的细节处理是我们对V500的初步评价，它的橘红色樱桃实木表面搭配黑色亚光钢琴漆面板显得档次较高。类梯形箱体让其视觉抢眼，这种设计能有效抑制中高频衍射并杜绝箱内低频谐振。厚实的实木板材让V500更稳，体现了它的扎实用料，

期刊

单元同轴高音声音低频音箱

引众厂商布局电视产业将迎第二春？

手机厂商布局电视领域，意欲何为？　　今年进入5 月以来，荣耀、Redmi先后推出了自己的电视产品，并且主打高性价比。而在此之前，华为、小米也都推出过智能电视产品，特别是小米，在销量上一骑绝尘。据奥维统计的数据显示，在2019年中国市场主要品牌出货量中，小米以1021万台的出货量位居第一，位居二、三名的是海信和创维，出货量分别是692万台和671万台。由此可见，小米电视在国内的出货量大幅领先其他传统

期刊

三星电视华为智能海信小米

百元级爆再升级罗技G102二代游戏鼠标

得益于MOBA游戏的持续火热，小巧、轻便且尺寸偏对称的游戏鼠标得到了越来越多玩家的青睐。针对这样的情形，不少厂商也推出了各自的解决万案，罗技便是其中之一——它于早前一段时间便推出了以实用为王且售价便宜的G102。但随着新竞品的推出以及时间的推移，这款产品的部分设计也急需做出一定的调整，于是小改款的罗技G102-代游戏鼠标就此诞生。　　小巧、耐看　　罗技G102二代游戏鼠标的外观设计依然和前作保持了

期刊

鼠标罗技游戏采用了按键这款

性能升级，激战到底 ROG魔霸5

方天画戟助吕布百战沙场，关羽携青龙偃月刀威震八方，那么对于想要在游戏中无往不利的玩家来说，一款怎样的“武器”才称手？搭载AMD锐龙95900HX处理器和NVIDIAGeForceRTX3060LaptopGPU的ROG魔霸5或许就是玩家驰骋游戏战场的利器。　　风格延续，细节升级　　一览R0G魔霸5外观设计，我们基本上可以称它是R0G魔霸4的“小改款”。因为它仍然延续了前作硬朗的设计风格，但细品之下

期刊

的是这款玩家刷新率游戏按键

性价比为王

千元级显卡市场一直以来都是厂商走量、玩家尤其是学生朋友非常关注、电脑城商家大力推荐的兵家必争之地。面对这个性价比卓著的热点市场，玩家们到底应该如何选择？有哪些产品可供选择？今天我们就来聊一聊千元级显卡市场。　　目前，无论在电脑城或者电商平台，大力推广的显卡产品多为干元级显卡，其中不乏GTX 950、GTX 960、R9 380……甚至清仓的GTX 760、GTX 750Ti。由于近两年AMD与NV

期刊

显卡功耗核心性能产品千元级

助力WiFi6普及　体验华硕RT-AX56U热血版

WiFi 6无疑是今年无线路由器市场的热点，涵盖各个价位段的大量新品上市，使得WiFi 6产品进入了普及快车道。在WiFi 6这波普及浪潮中，华硕无疑冲在业界前列，不论是踏入WiFi 6市场的时间节点，还是推出相关产品的数量，都位于前列。近期我们收到了华硕最新一款WiFi 6路由器新品RT-AX56U热血版，这次华硕直接将旗下WiFi 6路由器产品的门槛下拉到不足400元，光看价格是不是已经让你有

期刊

华硕热血三星路由器功能用户

1440p光追卡谁更“香”？ 5款非公版RTX3070Ti 显卡集中评测

凭借小幅增强的GPU和GDDR6X显存的加持，RTX 3070 Ti FE的整体性能在RTX 3070的基础上提升达到10%左右。不过对于持币待购的玩家来说，挑选一款非公版RTX 3070 Ti显卡当然不能只看性能，其外观、散热、用料等方面同样是考察的重点。本期MC就为大家献上5款非公版RTX 3070 Ti显卡的集中评测，大家不妨看看这5款显卡中有没有你的“菜”。　　“全”“超”“冷”理念新作　

期刊

显卡显存这款性能合金配备

AI时代的计算“芯”法

与本文相关的学术论文