论文部分内容阅读
在互联网广泛应用于电子商务并经历波浪起伏向前不断发展的今天,我们注意到在与高性能计算有关的科学合作领域,正在涌现出另一个具有划时代的新生事物-网格(Grid)。它的出现,将掀起互联网继传统互联网(Internet)、万维网(Web)之后的第三次浪潮,并将为信息产业带来无限商机。众所周知,由于美国军事科学合作的需要,美国国防部先进研究计划局(DARPA)于1969年,利用信息包传输和开放式整体结构技术,组建了ARPAnet,从而诞生了Internet。1990年,伯纳尔斯ダ*(Berners-Lee)在欧洲原子核研究中心(CERN)工作时,为了高能物理研究的需要发明了万维网。现在,历史又将重演。CERN正在计划建立一个新型而巨大的粒子对撞机,预计2005年完成。它所产生的数据量将是现在的1000倍,用当前的互联网技术已无法对付。因此,美国和欧洲的科学家们正在构造一种叫做网格的新型信息技术基础设施,它可以帮助科学家们自动地处理、组织、传输和管理这些数据,供欧美与CERN有关系的500多家大学和研究机构使用。不难预测,与万维网一样,原来为科研服务的网格也会很快用于传媒、传统产业、电子商务、娱乐等各个领域。
网格是什么?
美国阿岗(Argonne)国家实验室的资深科学家、美国网格计算项目的领导人,伊安ジK固*(Ian Foster),曾在1998年主编过题为《网格:21世纪信息技术基础设施的蓝图》的一本书。他这样描述网格:“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能则更多更强,能让人们透明地使用计算、存储等其他资源。” 由此可见,实际上传统互联网实现了计算机硬件的连通,Web实现了网页的连通,而网格试图实现互联网上所有资源的全面连通。它要把整个互联网整合成一台巨大的超级计算机,实现计算资源、存储资源、通信资源、软件资源、信息资源、知识资源的全面共享。互联网的第三次浪潮的实质,就是要将万维网(World Wide Web)升华为网格(Great Global Grid)。
网格的发展历史与现状
20世纪90年代初,根据网上主机大量增加,但其利用率却并不高的情况,美国国家科学基金会(NFS),将其4个超级计算中心构筑成一个能够进行元计算(meta-
computing)的整体。元计算的含义是通过网络,将计算资源连接起来,形成对用户透明的超级计算环境。近年来元计算的这个术语已被网格计算所代替。网格方面的代表性研究工作还有美国的“国家技术网格(NTG)”、“分布万亿次级计算设施(DTF)”、美国宇航局的IDG、美国能源部的ASCI Grid以及欧盟的Data Grid等。国际上的网格研究主要采用开放源码、公开合作的方式。有关网格研究的信息,可从“全球网格论坛”的网站(www.gridforum.org)上查阅。据悉,美国政府近十年来,累计用于网格的基础研究经费已近5亿美元。美国军方更为积极。美国国防部已在规划实施一个宏大的网格计划,叫做“全球信息网格”(Global Information Grid),预计在2020年完成。作为这个计划的一部分,美国海军和海军陆战队,已先期启动一个160亿美元的8年项目,包括系统的研制、建设、维护和升级。英国政府已决定投资1亿英镑,用来建设“英国国家网格(UK National Grid)”。
粗略地说,网格系统可以分为三个基本层次:资源层、中间件层和应用层。由于现在的互联网结构并不是针对网格计算设计的,为了使网格计算和现有的结构兼容,一般要有一个可扩展的中间件层。它是指一系列工具和协议软件,其功能是屏蔽网格资源层中计算资源的分布、异构特性(Heterogeneity),向网格应用层提供透明、一致的使用接口。网格的中间件层也称为网格操作系统(Grid Operating System),它同时需要提供用户编程接口和相应的环境,以支持网格应用的开发。上述以美国政府的研发机构为主的推动网格计算的项目,都采用了一种网络协议“Globus”。 Globus是以美国阿岗国家实验室为主,全美有12所大学和研究机构参与开发的网格项目。Globus对资源管理、安全、信息服务及数据管理等网格计算的关键技术进行研究,开发能在各种平台上运行的网格计算工具软件(Toolkit),帮助规划和组建大型的网格试验平台,开发适合大型网格系统运行的大型应用程序。Globus认为:在网络环境下的互操作,意味着需要开发一套通用协议,用它来描述信息的格式和信息交换的规则。Globus协议作为自由软件,已经在互联网上公开(www.globus.org)。Globus的网格计算协议是建立在互联网协议之上的,以互联网协议中的通信、路由、名字解析等功能为基础。Globus的协议分为5层:构造层、连接层、资源层、汇集层和应用层。上层协议可调用下层协议的服务。网格内的全局应用都通过协议提供的服务来调用操作系统。
最近,企业也预感到了网格潜藏着巨大市场,所以也纷纷加入了网格开发的队伍。美国微软公司已经决定支援Globus计划,日本的软库(Softbank)公司也向从事网格计算研究的新兴企业United Devices投资。除此以外,辉瑞(Pfizer)制药公司以及飞机制造商波音公司等大公司,都已开始进行有关网格计算的实验。目前它们实验的目标主要着眼于将其应用于大规模的科学仿真。IBM公司在2001年8月2日宣布,它将为网格计算投资约40亿美元。IBM公司近日宣布,它正在研制一种能被多家科研单位和众多科学家同时使用的超级计算机网格,预计它将在2002年第三季度建成。其设计运算速度为每秒13.6万亿次,比1997年战胜国际象棋特级大师卡斯帕罗夫的“深蓝”超级计算机速度快1000倍,其存储能力将达600万亿字节。它采用LINUX系统组合,网格的服务器装有英特尔公司生产的代号为McKinley的新一代Itaniium微处理器。据称,这个网格的功能将是目前全球同类系统中最强的。由此不难预测,网格将成为生物工程、气候模拟、能源探索、航空航天、数字地球等重要科技领域的重要工具。与此同时,网格技术也将提升电子商务到一个新的台阶,它将把互联网上的资源,整合成一台超级服务器,有效地为电子商务提供内容服务、计算服务、存储服务和交易服务等。
机遇与挑战
由于种种原因,我国错过了互联网的前两次浪潮即Internet和Web的核心技术的创新工作,这是造成我国的信息产业在总体上落后于西方国家的原因之一。目前,国际信息技术界正在酝酿着互联网的第三次浪潮。据目前的估计,网格的重要技术标准将在2004~2005年间出现。这对我们来说,现在正是一个难逢的历史机遇,但同时也提出了严峻的挑战。
为了实现网格的广泛应用,还必须解决下列问题:
(1) 要解决目前互联网的数据传输能力不足问题。为此,发展网格要和建设下一代宽带互联网(如美国的“下一代Internet(NGI)”和“Internet2”等)结合起来。另一方面,采用无线移动通信和卫星通信,也是一种现实的途径。
(2) 要进一步解决人机结合问题,使网格更加个性化、智能化和科学化。
(3) 要通过法律的手段解决网上资源共享中的知识产权、相互信任和报酬等问题。
(4) 最大的难题是如何保障网格计算的安全性。由于要在全球网络上实现资源共享,系统将更复杂,罪犯将更有机可乘。
钱学森先生最近说:“互联网的单元和子系统的数量巨大,各子系统之间或者单元之间的交互作用非常复杂,而且还有人与互联网的联系,以及以互联网为基础的经济所引发的种种问题等。所以,互联网正好生动地体现了开放的复杂巨系统的概念。这方面的研究非常有现实意义。”笔者认为,未来的网格,更是这种开放的复杂巨系统概念的生动体现,而开放的复杂巨系统理论对于全面解决网格的资源共享、人机结合和信息安全等问题,将有重大的指导意义。另一方面 ,网格的实现,也将为解决复杂巨系统问题的综合集成技术打下坚实的技术基础。
网格是什么?
美国阿岗(Argonne)国家实验室的资深科学家、美国网格计算项目的领导人,伊安ジK固*(Ian Foster),曾在1998年主编过题为《网格:21世纪信息技术基础设施的蓝图》的一本书。他这样描述网格:“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能则更多更强,能让人们透明地使用计算、存储等其他资源。” 由此可见,实际上传统互联网实现了计算机硬件的连通,Web实现了网页的连通,而网格试图实现互联网上所有资源的全面连通。它要把整个互联网整合成一台巨大的超级计算机,实现计算资源、存储资源、通信资源、软件资源、信息资源、知识资源的全面共享。互联网的第三次浪潮的实质,就是要将万维网(World Wide Web)升华为网格(Great Global Grid)。
网格的发展历史与现状
20世纪90年代初,根据网上主机大量增加,但其利用率却并不高的情况,美国国家科学基金会(NFS),将其4个超级计算中心构筑成一个能够进行元计算(meta-
computing)的整体。元计算的含义是通过网络,将计算资源连接起来,形成对用户透明的超级计算环境。近年来元计算的这个术语已被网格计算所代替。网格方面的代表性研究工作还有美国的“国家技术网格(NTG)”、“分布万亿次级计算设施(DTF)”、美国宇航局的IDG、美国能源部的ASCI Grid以及欧盟的Data Grid等。国际上的网格研究主要采用开放源码、公开合作的方式。有关网格研究的信息,可从“全球网格论坛”的网站(www.gridforum.org)上查阅。据悉,美国政府近十年来,累计用于网格的基础研究经费已近5亿美元。美国军方更为积极。美国国防部已在规划实施一个宏大的网格计划,叫做“全球信息网格”(Global Information Grid),预计在2020年完成。作为这个计划的一部分,美国海军和海军陆战队,已先期启动一个160亿美元的8年项目,包括系统的研制、建设、维护和升级。英国政府已决定投资1亿英镑,用来建设“英国国家网格(UK National Grid)”。
粗略地说,网格系统可以分为三个基本层次:资源层、中间件层和应用层。由于现在的互联网结构并不是针对网格计算设计的,为了使网格计算和现有的结构兼容,一般要有一个可扩展的中间件层。它是指一系列工具和协议软件,其功能是屏蔽网格资源层中计算资源的分布、异构特性(Heterogeneity),向网格应用层提供透明、一致的使用接口。网格的中间件层也称为网格操作系统(Grid Operating System),它同时需要提供用户编程接口和相应的环境,以支持网格应用的开发。上述以美国政府的研发机构为主的推动网格计算的项目,都采用了一种网络协议“Globus”。 Globus是以美国阿岗国家实验室为主,全美有12所大学和研究机构参与开发的网格项目。Globus对资源管理、安全、信息服务及数据管理等网格计算的关键技术进行研究,开发能在各种平台上运行的网格计算工具软件(Toolkit),帮助规划和组建大型的网格试验平台,开发适合大型网格系统运行的大型应用程序。Globus认为:在网络环境下的互操作,意味着需要开发一套通用协议,用它来描述信息的格式和信息交换的规则。Globus协议作为自由软件,已经在互联网上公开(www.globus.org)。Globus的网格计算协议是建立在互联网协议之上的,以互联网协议中的通信、路由、名字解析等功能为基础。Globus的协议分为5层:构造层、连接层、资源层、汇集层和应用层。上层协议可调用下层协议的服务。网格内的全局应用都通过协议提供的服务来调用操作系统。
最近,企业也预感到了网格潜藏着巨大市场,所以也纷纷加入了网格开发的队伍。美国微软公司已经决定支援Globus计划,日本的软库(Softbank)公司也向从事网格计算研究的新兴企业United Devices投资。除此以外,辉瑞(Pfizer)制药公司以及飞机制造商波音公司等大公司,都已开始进行有关网格计算的实验。目前它们实验的目标主要着眼于将其应用于大规模的科学仿真。IBM公司在2001年8月2日宣布,它将为网格计算投资约40亿美元。IBM公司近日宣布,它正在研制一种能被多家科研单位和众多科学家同时使用的超级计算机网格,预计它将在2002年第三季度建成。其设计运算速度为每秒13.6万亿次,比1997年战胜国际象棋特级大师卡斯帕罗夫的“深蓝”超级计算机速度快1000倍,其存储能力将达600万亿字节。它采用LINUX系统组合,网格的服务器装有英特尔公司生产的代号为McKinley的新一代Itaniium微处理器。据称,这个网格的功能将是目前全球同类系统中最强的。由此不难预测,网格将成为生物工程、气候模拟、能源探索、航空航天、数字地球等重要科技领域的重要工具。与此同时,网格技术也将提升电子商务到一个新的台阶,它将把互联网上的资源,整合成一台超级服务器,有效地为电子商务提供内容服务、计算服务、存储服务和交易服务等。
机遇与挑战
由于种种原因,我国错过了互联网的前两次浪潮即Internet和Web的核心技术的创新工作,这是造成我国的信息产业在总体上落后于西方国家的原因之一。目前,国际信息技术界正在酝酿着互联网的第三次浪潮。据目前的估计,网格的重要技术标准将在2004~2005年间出现。这对我们来说,现在正是一个难逢的历史机遇,但同时也提出了严峻的挑战。
为了实现网格的广泛应用,还必须解决下列问题:
(1) 要解决目前互联网的数据传输能力不足问题。为此,发展网格要和建设下一代宽带互联网(如美国的“下一代Internet(NGI)”和“Internet2”等)结合起来。另一方面,采用无线移动通信和卫星通信,也是一种现实的途径。
(2) 要进一步解决人机结合问题,使网格更加个性化、智能化和科学化。
(3) 要通过法律的手段解决网上资源共享中的知识产权、相互信任和报酬等问题。
(4) 最大的难题是如何保障网格计算的安全性。由于要在全球网络上实现资源共享,系统将更复杂,罪犯将更有机可乘。
钱学森先生最近说:“互联网的单元和子系统的数量巨大,各子系统之间或者单元之间的交互作用非常复杂,而且还有人与互联网的联系,以及以互联网为基础的经济所引发的种种问题等。所以,互联网正好生动地体现了开放的复杂巨系统的概念。这方面的研究非常有现实意义。”笔者认为,未来的网格,更是这种开放的复杂巨系统概念的生动体现,而开放的复杂巨系统理论对于全面解决网格的资源共享、人机结合和信息安全等问题,将有重大的指导意义。另一方面 ,网格的实现,也将为解决复杂巨系统问题的综合集成技术打下坚实的技术基础。