论文部分内容阅读
Telsa成为NVIDIA试水流计算商业化的先锋
随着科技的发展,地球科学、分子生物学和医药诊断学等领域中的研究进展非常迅速。尽管在高性能计算的帮助下,新的研究成果每天都在改变着数十亿人的命运,不过专注于以上及其他领域的大学、研究机构和公司正面临着严峻的挑战。随着技术革新速度的加快,他们对收集处理千兆字节数据的大型计算资源的需求也与日俱增,因此以流计算(Stream Computing)为代表的新技术应运而生。最近,各大公司都开始加快流计算技术的商业化步伐,推出了相应的产品来诠释流计算商业化的发展方向。
IBM:进军流计算
6月19日,在美国纽约举行的2007年度IT管理展会上,IBM展示了一款名为System S的系统原型。System S采用新的体系架构,可迅速分析多个数据源的信息流,从而大大提高相关领域决策的速度和精确性,例如安全监控和股票实时交易。有分析师指出,这是流计算这种新兴技术商业化应用的具有重大意义的一步。也有业内专家表示,IBM选择在这样一个展会上推出这套系统,主要看中的正是纽约华尔街公司对于新技术的接纳速度。
据悉,IBM为了将流计算技术推向市场,目前正在寻求业内的合作伙伴。IBM表示,最初的System S将可运行800个微处理器,如果需要,微处理器数量可增加到数万个。System S最值得称道的,是与硬件系统配套提供的System S系统软件。该软件可让应用程序分别处理诸如图像识别和文本识别之类的任务,然后重新整合,再对计算问题做出回答。
IBM表示,System S系统提供了一个高级的操作环境、与之配套的软件算法和过滤器,它可以充分利用现有的高性能计算硬件设备,比如IBM的Cell项目和Blue Gene超级计算机。
Google:收购流计算
颇为巧合的是,就在IBM宣布推出System S系统不久之前,著名的互联网企业Google收购了一家名为PeakStream的流计算公司,表明它也对流计算产生出极大的兴趣。成立于2005年的PeakStream专门针对多核及平行处理器提供程序设计工具的开发与设计,其开发的软件可进行硬件资源的分配,让程序设计人员充份利用多核及图形芯片的能力。目前针对单核处理器的开发软件已经成熟,而针对多核的开发软件仍属新兴领域。
对于此次收购,Google表示,PeakStream团队的技术能力能够协助该公司提升产品品质及功能,并能造福全球Google的使用者。而Google也会为该团队提供更多的资源,让该团队可针对现在的硬件系统持续开发高效能的应用程序。
专业人士分析,互联网企业Google已经将传统的计算模型——事务处理发挥至极致,而这种计算模型已经被应用了长达50年之久,基本没有继续改进的可能性。而流计算恰巧就是一种可以替代传统事务处理的新型计算模型,它的发展前景无可限量。专家认为,这也正是Google收购PeakStream的真正原因。
NVIDIA:流计算GPU
6月21日,NVIDIA公司发布GPU计算产品的新成员——NVIDIA Tesla ,此产品为科学家和工程师在“个人超级计算”领域的研究开启了一个新纪元。“当今的科学不再局限在试验室中,在一个单独的物理实验实施前,科学家经常会进行计算机仿真。这个基本改变正在为科学研究和工程学的发现建立一种新方法。” NVIDIA总裁兼CEO Jen-Hsun Huang说,“通过某些情况下几个小时到几周时间的节省,NVIDIA Tesla显示了在高性能计算领域前所未有的重要突破。”
NVIDIA Tesla系统可根据计算的需求部署,共分为三种不同的型号。
最简单的Tesla GPU系统只有一块专用计算卡,可以安装到PC或工作站中。
而Tesla桌边型超级计算机(Deskside Supercomputer)包括两颗NVIDIA Tesla GPU(最高可支持8颗处理器),并通过一个PCI-E接口线缆与台式机或工作站连接。通过桌边(Deskside)体系架构,该技术可以将一台普通的个人电脑或工作站变为一台个人超级计算机,提供高达每秒8万亿次浮点运算能力的计算能力。
性能最高的Tesla GPU计算服务器(Computing Server),是一台具有8颗NVIDIA Tesla GPU的1U服务器。它通过PCI-E线缆与集群服务器相连,可为集群服务器增加每秒4万亿次的浮点运算并行处理能力。值得一提的是,Tesla GPU计算服务器是第一款可以为数据处理中心提供GPU计算能力的产品。
硬件的突破还需要软件与之配合,NVIDIA在推出Tesla之前就已经做好了准备。它为软件开发人员提供了专用软件工具CUDA,它包括了一个用于GPU的C编译器、调试工具以及专用的驱动程序。CUDA可以将一个应用程序分割为几部分,交由GPU处理,充分利用GPU的运算能力。
机遇与挑战并存
流计算的优势显而易见,但是由于它对传统计算模式的改变,对于软硬件的需求都有了很大的改变,这给IT产业带来了革命性的挑战:必须改变现有的软硬件架构,才能够适应流计算的需求。对于在传统计算模式已经投入巨大资金和人力的传统IT企业而言,转向流计算将会是一个非常痛苦过程。此外,也有专家认为,流计算是否能够成为主流还有待市场检验。毕竟技术领先而最终夭折的例子,在整个IT领域已经屡见不鲜。
链 接:流计算能做什么
流计算旨在解决两个问题:第一是在商业计算和科学计算中更快地处理与分析数据;第二是应对数字化信息爆增的洪流,包括网站、博客、电子邮件、视频和新闻短片,还有视频电话、数据传输和电子传感器这类信息流。
在通常情况下,用电脑进行计算和数据分析的步骤是:首先搜集数据,将其储存在数据库程序中,然后再用模型或提问方式对数据库进行搜索。
这是一种有效的方式,但它是高度结构化的,而且通常需要耗费很多时间。
反之,在流计算模式下,先进的软件算法在数据流入同时即对其进行分析。例如,利用文本、语音和图像的识别技术,可确定某些数据比其他数据更为重要(就解决某项特殊任务而言)。优先的数据被输入专门定制的程序,这种程序的目标是处理复杂而快速变化的问题,比如追踪某种传染病并预报疾病传播速度。或者分析芯片工厂中电子传感器传来的制造数据,以便迅速校正生产缺陷。
随着科技的发展,地球科学、分子生物学和医药诊断学等领域中的研究进展非常迅速。尽管在高性能计算的帮助下,新的研究成果每天都在改变着数十亿人的命运,不过专注于以上及其他领域的大学、研究机构和公司正面临着严峻的挑战。随着技术革新速度的加快,他们对收集处理千兆字节数据的大型计算资源的需求也与日俱增,因此以流计算(Stream Computing)为代表的新技术应运而生。最近,各大公司都开始加快流计算技术的商业化步伐,推出了相应的产品来诠释流计算商业化的发展方向。
IBM:进军流计算
6月19日,在美国纽约举行的2007年度IT管理展会上,IBM展示了一款名为System S的系统原型。System S采用新的体系架构,可迅速分析多个数据源的信息流,从而大大提高相关领域决策的速度和精确性,例如安全监控和股票实时交易。有分析师指出,这是流计算这种新兴技术商业化应用的具有重大意义的一步。也有业内专家表示,IBM选择在这样一个展会上推出这套系统,主要看中的正是纽约华尔街公司对于新技术的接纳速度。
据悉,IBM为了将流计算技术推向市场,目前正在寻求业内的合作伙伴。IBM表示,最初的System S将可运行800个微处理器,如果需要,微处理器数量可增加到数万个。System S最值得称道的,是与硬件系统配套提供的System S系统软件。该软件可让应用程序分别处理诸如图像识别和文本识别之类的任务,然后重新整合,再对计算问题做出回答。
IBM表示,System S系统提供了一个高级的操作环境、与之配套的软件算法和过滤器,它可以充分利用现有的高性能计算硬件设备,比如IBM的Cell项目和Blue Gene超级计算机。
Google:收购流计算
颇为巧合的是,就在IBM宣布推出System S系统不久之前,著名的互联网企业Google收购了一家名为PeakStream的流计算公司,表明它也对流计算产生出极大的兴趣。成立于2005年的PeakStream专门针对多核及平行处理器提供程序设计工具的开发与设计,其开发的软件可进行硬件资源的分配,让程序设计人员充份利用多核及图形芯片的能力。目前针对单核处理器的开发软件已经成熟,而针对多核的开发软件仍属新兴领域。
对于此次收购,Google表示,PeakStream团队的技术能力能够协助该公司提升产品品质及功能,并能造福全球Google的使用者。而Google也会为该团队提供更多的资源,让该团队可针对现在的硬件系统持续开发高效能的应用程序。
专业人士分析,互联网企业Google已经将传统的计算模型——事务处理发挥至极致,而这种计算模型已经被应用了长达50年之久,基本没有继续改进的可能性。而流计算恰巧就是一种可以替代传统事务处理的新型计算模型,它的发展前景无可限量。专家认为,这也正是Google收购PeakStream的真正原因。
NVIDIA:流计算GPU
6月21日,NVIDIA公司发布GPU计算产品的新成员——NVIDIA Tesla ,此产品为科学家和工程师在“个人超级计算”领域的研究开启了一个新纪元。“当今的科学不再局限在试验室中,在一个单独的物理实验实施前,科学家经常会进行计算机仿真。这个基本改变正在为科学研究和工程学的发现建立一种新方法。” NVIDIA总裁兼CEO Jen-Hsun Huang说,“通过某些情况下几个小时到几周时间的节省,NVIDIA Tesla显示了在高性能计算领域前所未有的重要突破。”
NVIDIA Tesla系统可根据计算的需求部署,共分为三种不同的型号。
最简单的Tesla GPU系统只有一块专用计算卡,可以安装到PC或工作站中。
而Tesla桌边型超级计算机(Deskside Supercomputer)包括两颗NVIDIA Tesla GPU(最高可支持8颗处理器),并通过一个PCI-E接口线缆与台式机或工作站连接。通过桌边(Deskside)体系架构,该技术可以将一台普通的个人电脑或工作站变为一台个人超级计算机,提供高达每秒8万亿次浮点运算能力的计算能力。
性能最高的Tesla GPU计算服务器(Computing Server),是一台具有8颗NVIDIA Tesla GPU的1U服务器。它通过PCI-E线缆与集群服务器相连,可为集群服务器增加每秒4万亿次的浮点运算并行处理能力。值得一提的是,Tesla GPU计算服务器是第一款可以为数据处理中心提供GPU计算能力的产品。
硬件的突破还需要软件与之配合,NVIDIA在推出Tesla之前就已经做好了准备。它为软件开发人员提供了专用软件工具CUDA,它包括了一个用于GPU的C编译器、调试工具以及专用的驱动程序。CUDA可以将一个应用程序分割为几部分,交由GPU处理,充分利用GPU的运算能力。
机遇与挑战并存
流计算的优势显而易见,但是由于它对传统计算模式的改变,对于软硬件的需求都有了很大的改变,这给IT产业带来了革命性的挑战:必须改变现有的软硬件架构,才能够适应流计算的需求。对于在传统计算模式已经投入巨大资金和人力的传统IT企业而言,转向流计算将会是一个非常痛苦过程。此外,也有专家认为,流计算是否能够成为主流还有待市场检验。毕竟技术领先而最终夭折的例子,在整个IT领域已经屡见不鲜。
链 接:流计算能做什么
流计算旨在解决两个问题:第一是在商业计算和科学计算中更快地处理与分析数据;第二是应对数字化信息爆增的洪流,包括网站、博客、电子邮件、视频和新闻短片,还有视频电话、数据传输和电子传感器这类信息流。
在通常情况下,用电脑进行计算和数据分析的步骤是:首先搜集数据,将其储存在数据库程序中,然后再用模型或提问方式对数据库进行搜索。
这是一种有效的方式,但它是高度结构化的,而且通常需要耗费很多时间。
反之,在流计算模式下,先进的软件算法在数据流入同时即对其进行分析。例如,利用文本、语音和图像的识别技术,可确定某些数据比其他数据更为重要(就解决某项特殊任务而言)。优先的数据被输入专门定制的程序,这种程序的目标是处理复杂而快速变化的问题,比如追踪某种传染病并预报疾病传播速度。或者分析芯片工厂中电子传感器传来的制造数据,以便迅速校正生产缺陷。