OpenPOWER+CAPI实现第二代分布计算

来源 :电子产品世界 | 被引量 : 0次 | 上传用户:sisu16113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文介绍了CAPI技术,并给出基于CAPI应用的三个案例。本文网络版地址:http://www.eepw.com.cn/article/281881.htm
  关键词:CAPI;CPU;FPGA
  DOI:10.3969/j.issn.1005-5517.2015.10.005
  1.向第二代分布计算演进
  最早的时候计算机系统单任务的,随着数据量的增加,单计算任务的处理能力已不足以满足人们日益增长的需求,所以计算机系统逐渐演进到多任务的计算环境,同时有多个CPU运行(图1),这就产生一个访问内存中的数据,数据的一致性是要急需解决的问题。那么什么是数据一致性的问题呢?当一个CPU对一个数据进行操作之后,另外一个CPU需要拿到正确的数据。
  在系统里面,电脑是用硬件来保证数据一致性,同时保证另外一个线程在读取数据的时候能读取到正确的数据。如图2所示,图2中有6个CPU核,每个CPU核都有自己的缓存,他们共享了一个更大的主存。图2展示第一个POWER上面的崭新的应用,要对地址为1000的应用进行操作。第一个应用会把这个地址为1000的数据从主存里面读到自己的缓存上面,并且对它进行修改,比如把它修改成绿色,有另外一个应用跑在了第三个CPU核上面,它也是读取地址为1000的数据,应该期望的是它读到的是绿色的数据而不是原来白色的数据。同样第三个核上的应用会把这个数据进行改写,比如改写成红色,这时候如果还有另外一个应用跑在了第四个第五个核上面的应用,它也会去读取这个数据,也应该期望它能够读到红色的数据,这背后都是由一个内存通知器硬件来帮软件完成这些数据的一致性,保证它们读到的数据都是最新的数据。当计算机系统从一个单CPU系统进化到多CPU系统的时候,它的性能功耗比其实是在下降的,所以现在可以用这样的系统处理更多的数据,比如在线交易业务、企业ERT业务、数据库业务等。
  随着互联网的普及,数据量比以往更多。对于系统来说需要更强的硬件计算能力,来处理更多的数据。常见的解决方案是在CPU核上,开辟更多个硬件的线程,用这些线程来提高其处理能力,来帮助它对I/O端口过来的数据进行更好的处理,同时加入了GPU和FPGA,使用这些硬件来帮助系统处理数据(图3)。但是传统上GPU和FPGA都是以I/O设备的形式挂载在这个系统上面,为了使用I/O设备,需要提高技能,如编程人员需要学习硬件知识,需要懂得内核的人为I/O设备进行驱动的开发,同时由于它们是I/O设备,没有和CPU共享内存,所以需要内核代码帮助他们做数据传输。摆在面前的另外一个难题就是半导体技术的性价比不再持续增长,现在已经到了一个拐点,不能依赖于半导体技术的增长使系统更快更强,需要从硬件还有固件、操作系统、设备应用等多角度考虑,寻求一个更好的解决方案。
  为了解决这种需求,现在引入FPGA使用CAPI(相干加速器处理器接口)接入系统更快更好地处理数据。随着移动互联网的发展,这样数据会比以往更多,所以我们需要硬件来帮助系统处理数据。当然整个系统不是IBM提供的封闭系统,虽然IBM也有一个192线程的机器,再加上FPGA的板卡,但是IBM没有提供这样一个封闭系统,相反IBM会有更多的合作伙伴,比如中太数据的服务器、NVIDIA的GPU、赛灵思的FPGA芯片、恒扬的FPGA板卡解决方案,还有Ubuntu的操作系统解决方案、三星提供的存储解决方案。以一个合作伙伴的形式,向更多的企业提供应用,提供服务。
  CAPI可以使FPGA连接到系统上面(如图4),通过在FPGA上面内嵌了一点处理逻辑,使FPGA上面的硬件可以和CPU线程共同共享一段虚拟的地址空间,在CPU上的线程会产生数据,同时也会产生一个任务队列,队列可以定义指导FPGA上面硬件如何对数据进行操作。在新一代的系统里面,允许FPGA硬件和CPU上面软件共享虚拟的地址空间,并且它们的一致性是由硬件来进行维护。通过一个调动CPU上的软件可以触发IPA硬件去任务队列里面获取任务的描述,然后FPGA通过共享的存储空间来读取内存上面的数据,并产生结果,这些结果和数据都可以被CPU上软件直接访问的。IBM已有系统是工作在这样的模式。用CAPI技术不再需要面对之前麻烦,但是因为FPGA软件员不需要再去了解具体的硬件是如何工作,FPGA工作在协处理器的模式共享内存。
  图5是一个OpenPOWER的机器,在红色的两个圈子里是两个POWER8的处理器模块,绿色的地方是可以插两个CAPI板卡的地方。
  2.解决方案的案例
  CAPI可以在哪里应用呢?向大家介绍三个案例,癌症的治疗方案、银行欺诈的检测、零售业水平的分析。
  2.1癌症治疗方案
  医生可以把一些药物注入到癌细胞里面,癌细胞吸收了药物之后就有可能被治疗,看上去也非常好,但是有一个问题,当癌细胞多了以后,很难区分跟正常机体的区别,所以导致药物有可能误伤。为了让治疗更加安全高效,医生需要模拟这种药物在人体生效的过程,传统理念针对一个人需要模拟大概两周的时间,给病人制定一个最佳的治疗方案。现在,为了模拟这种情况,使用一种叫做FullMonte蒙特卡罗模拟的方法,模拟光子在吸收前在体内的散射情况,对这种行为进行建模并且进行模拟。在蒙特卡罗模拟里面(图6),每个光子大概需要1000多次循环,模拟它在人体中的飞行,同时会有更多的光子需要在并行的被模拟,通过CAPI接口使用FPGA硬件来对这样的行为模拟。现在已经可以通过FPGA加速大大缩短时间,两个小时就可以完成这样的模拟,如果使用传统的计算机结构再加上PCI的FPGA,可以获得比软件快4倍的能力,如果使用CAPI再加上POWER8机器的话,可以获得64倍性能的提升。
  2.2银行欺诈检测
  开户的时候,在身份证或者护照上都会有照片,还有文档上会写地址等信息,拿着身份证或护照信息来到银行,就可以开户。这个问题就在于如果这个人使用同样一张照片但是用不同的名字,他可以去到另外一个地方的另外一家银行,可能会开一个新的账号,如此反复他就可以用不同的身份去开更多个帐号。银行解决这个问题的唯一办法就是因为他们会使用同样一张照片,银行可以对这些照片进行存储,这样银行会有存储数百万张人脸的照片。
  使用CAPI,可以实现一个训练的引擎,神经网络还有视频等算法把这些图片变成一个数据库。使用这样的方式可能在很短的时间内从数百万张照片里匹配出一个指定的人脸。这样当有一个新用户来到银行的时候,他就可以把新用户的脸形跟所有数据库里面数百万张照片进行匹配,可以发现他是匹配还是不匹配。在系统里使用CAPI,它不是以I/O设备存在这个系统,而是像一个协处理器之间来处理数据,软件线程只需要做一些初始化的设置,然后全部的计算任务都交给CAPI上面的加速器来进行计算(图7)。
  2.3零售业视频分析
  还有另外一个例子,把安全摄像头系统接入到CAPI系统上面,CAPI系统可以实时地对视频上面的各种目标进行识别,比如你可以查询在某一个时间段之内有多少蓝色的汽车停靠。可以使用人脸识别对人的表情进行识别,比如识别这个人高兴、伤心还是意外,通过对脸的表情进行训练的话,可以迅速对一个实时的人脸进行识别。还可以展示另外一个场景,推着这个购物车的时候可以对货架上的商品进行识别。当推着这个购物车在货架前走过的时候,通过实时的视频分析,可以知道哪个货架上已经缺货,货品已经被卖光了,或者通过视频分析得知某一件商品被放到了不应该被的位置上面,同时结合前面介绍的人脸分析,当一个人把东西从货架拿起来的时候,可以知道他是否满意商品,假设他把这个商品放到购物车里面,可以知道这个人对这个商品很满意,同时如果识别出他对这个货品并不感兴趣,把这个物品又放回到货架上面,那就会知道这个人对这个货品并不满意。但是可以通过给他更高的折扣来吸引他。想象一下SV可以通过这样一个场景来帮助这样的零售商做更好的客户开发。
其他文献
中国要强,农业必须强农业是立国之本,强国之基。中国农业要强起来,当务之急,是尽快从主要追求产量和依赖资源消耗的粗放经营转变到数量质量效益并重、注重提高竞争力、注重农业科
本文为了获取指针式仪表的示数,研究了基于图像处理的示数自动判读算法。根据采集到的仪表示数图像,首先采用预处理增强、降采样及二值化、旋转投影指针的方法提取出指针所在的区域;然后选取备选区域并进行二值化处理,在备选区域中定位了针尖的位置;最后对刻度线进行标记和排序,完成了示数判读。结果表明,测量的214幅图像中,误差小于仪表最小分度值5%的读数占85.05%。
冬天一到,有些人就特别怕冷,这是因为体内缺铁,血红素较少,影响了血液的携氧能力,导致组织能量代谢发生了障碍,产生的热量不足而感到异常寒冷,中医认为,怕冷是阳虚生内寒的结果,
1,暗色调墙面。墙面颜色的选择应以相对明亮的颜色为好,这样可以给人宽敞明亮的视觉效果。小户型在墙面颜色的选择上相对有一定的难度,因为空间有一定的局限性,我们并不建议选择
因集中流行于山东省临沂市郯城、马头一带而得名的郯马五大调,又称“郯马调”,也称“淮调”“五大调”。它是一种十分古老的民间歌曲演唱形式,其节奏平实徐缓,歌词高雅隽永,多以叙
在和平与发展的时代背景下,资本主义与社会主义以并存、交叉的状态将同处于一个相当长的历史时期加上多年来社会主义在建设发展的过程中遭遇了种种挫折和失误,难免会导致人们对
摘要:介绍了基于FPCJA和高速串行复接/解复接技术,将3G/HD/SD-SDI信号通过光纤实现无损长距离传输的方法。与传统的传输方案相比,此方案可以完成传输高清视频的平滑升级,并向下兼容现有的视频传输网络,降低了网络的改造升级成本。本文网络版地址:http://www.eepw.com.cn/article/279223.htm  关键词:3G/HD/SD-SDI;光纤传输;自动均衡;时钟恢复 
我国的改革开放从十一届三中全会起已经历了20年的洗礼,取得了巨大成功。我们从中国尚处于社会主义初级阶段这个基本国情出发,探索了一条渐进式的改革之路。从经济体制改革来说,就
民事诉讼中法院调解制度在我国有着优良的传统和深厚的历史背景,并因其独特的优势得到了司法工作者的偏爱。然而,现行司法实务中,调解结案的方式已经过分白热化,给判决结案造成了
五四时期的思想解放运动具有鲜明的时代特点,当时的先进分子把握历史发展的大趋势,不断追求真理,敢于否定自我,把思想解放和改造中国社会紧密相联,把思想解放和革命实践紧密结合,终