论文部分内容阅读
网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能则更多更强,使人们能够透明地使用计算、存储等其他资源。可以说,网格是一个一体化的网络基础设施,其目的是利用高速网络把分散在不同地理位置的各类计算机(计算机群)、数据源、外围设备等连接起来,组织成一台“虚拟的超级计算机”,形成对用户相对透明的虚拟高性能计算环境,实现计算资源、数据资源、信息资源、知识资源、存储资源、通信资源等多种资源的高度共享与高速存取,向每一个用户提供一体化的服务。
一、网格技术在数字信息服务中的应用
实现网格技术在信息服务中应用的关键在于网格管理软件。网格管理软件实际上是更高层次的网格操作系统,其核心技术主要是一体化的信息平台(单一系统映象)、语义网站(Web)、智能代理和知识本体技术等。信息服务网格所提供的服务包括文件消息、计算、信息内容、事务处理和知识服务等,因此信息服务网格可大致分为计算网格、信息网格与知识网格。其中,计算网格提供原始计算能力、高速宽带和数据处理。要实现上述功能,必须与网络连接,并具有浮点计算和逻辑数据处理能力。信息网格采用接口连接主要的信息资源,允许同质对非同质分布信息进行访问。信息网格也需要高级分析以减少得到各种形式的信息所带来的技术的复杂性。知识网格使用基于知识的方法学和技术学,包括知识工程工具、智能软件代理、数学建模、模拟、计划等。知识网格也应对决策制定和假设产生提供智能指南。存储在知识网格中的信息资源应允许支持低层信息和数据的挖掘。来自网格层的知识应能控制计算层中的数据获取。
数字信息服务方式的变革将是网格技术直接应用的结果,特别是对于对等计算技术的关注,反映了数字信息服务系统对于高效率、低成本和高可靠性的基础技术环境的需求。对等计算和对等网络,简单地说就是计算机系统间通过网络的直接数据交换实现计算机资源和服务的共享,这些资源和服务包括信息交换、处理能力、高速缓存、备份设备和文件磁盘空间等。对等计算环境具有可以降低计算成本、提高可扩展性、便于工作组间的协调和分布式计算等优点。为了更好地实现各个子系统之间、人与资源之间的交互操作,需要基于本体建立统一的语义描述,应用XML语言作为网上数据交换标准,进而给予统一描述的知识实现系统互操作。基于网格技术的层次化数字信息服务体系结构(见图1)由以下6个部分组成:
1.数据网格与计算网格
它们是数字信息服务平台的基础组成部分。数椐网格可以集成多种异构、分布的数据源,进而为海量数据的存储、传输、处理与融合提供基础框架。计算网格由多个服务器集群构成,是大型、分布式系统的自然延伸,通过集群技术将多个单位的服务器融合成一台透明的、功能强大的“高性能计算机”,用于提供高性能计算服务。
2.信息资源网格
它基于数据网格和计算网格构建,是数字信息服务平台的重要组成部分。该层对于来自数据网格的数据和计算网格的计算结果进行处理,进而形成信息资源,并将其提供给服务网格层。
3.服务网格
它是数字信息服务系统的核心组成部分和主要功能单元。服务网格提供数字信息服务系统所支持的各种服务,同时对于各个部门的应用系统提供服务支持,这种服务支持包括信息、知识、计算和智能信息处理服务等。服务网格提供的服务大多是单台计算机或单个子系统无法提供的服务,如协作计算、大规模实时多媒体应用等,同时可用于建立虚拟环境,使不同组织的人、系统可以协同和交互。
4.系统建模与应用模板
它们根据来自应用系统和个性化信息服务访问接口的不同要求,相应地生成专有的系统模型和应用模板。服务网格根据其所生成的系统模型和应用模板,向应用系统或用户提供符合其要求的服务。
5.个性化信息服务访问接口
它是数字信息服务平台的重要功能单元,是信息服务平台通用性、交互性、实时性的重要表现部分。针对读者的不同应用需求,数字信息服务平台各个应用子系统通过该接口可以很好地与数字信息服务平台进行交互,进而获取“量身订制”的个性化服务。
6.开发规范与管理控制平台
它是数字信息服务平台的中央控制单元,通过该平台的集中统一控制,使得新建的数字信息服务平台子系统及服务网格、信息网格、数据网格和计算网格的各个子系统符合统一的规范,利于实现系统间的互通、互联和互操作,进而在管理控制平台的统一控制、协调下发挥出最优化的效用。
二、基于网格技术的:数字信息服务模式
1.信息集成服务模式
信息集成服务是一个现代化的信息服务概念,是对信息资源、技术资源和人力资源进行融合的过程,是分布式服务的飞跃。集成服务一定要面向用户、面向任务,有明确的目标或主题。
网格最早是以集成异构计算平台的身份出现,接着跨入分布式海量数据处理领域,并将在信息集成领域一层身手。所谓信息网格,就是要通过统一的信息交换架构和大量的中间件,向用户提供“信息随手可得”式的服务。信息网格研究的中心问题有如何描述信息、存储信息、发布信息和查找信息;如何将异构平台、不同格式、不同表述方式的信息进行转换,实现信息的无障碍交换;如何充分利用现有网络技术,如HTYP、XML、WSDL、UDDI、SOAP等,构成一个完整的服务链;信息的语义表示,即如何赋予信息内涵,以及如何避免信息的二义性;如何对信息加密、防止信息泄露等等。
数字信息集成服务模式就是对具有差异性、分布性、管理的自治性的数字信息资源、技术、人员、机构与服务功能进行集成,实现对分散的数字信息资源系统的有效控制,使用户得到动态的并在时间和空间上一致面向问题的全方位、多层次、多元化的信息服务,从而构建数字信息面向用户的高效能、综合化的信息集成服务体系。它以信息服务内容与产品的集成为目标,以功能的集成作为结构,以平台的集成作为技术的基础,以人的集成作为根本保证,最终形成统一的检索平台、一次性用户认证、不同系统之间的无缝链接和完整的集成化数字信息服务综合平台体系。其服务模式如图2所示。
可以预见,信息集成将是网格最有可能流行起来的应用方向。2004年1月20日,Globus联盟、IBM、和HP等联合发布了新的网格标准草案WSRF(Web Se~ices Resource Frame·work),把OGSI转换成了6个用于扩展WebSe~ices的规范。这时,网格服务已经与Web服务彻底融为一体。这标志 着网格已经调整好方向,将信息集成作为第一目标。数字信息服务模式的发展趋势应当朝着一种面向用户的,资源系统、服务系统与用户信息利用系统聚合在同一信息空间的、智能化的集成信息服务模式的方向发展。
2.数字化知识服务模式正在兴起的网格技术,为人们对知识信息的需求由文本单元向知识单元深度发展提供了实现的可能性,同时也要求人类采用新的知识组织方式来建立知识管理的大平台。它将改变人类知识生产、知识传播、知识创新、知识分配的传统方式。网格技术将会给知识服务带来革命,并将引发知识管理学的诞生。构建网格的目的在于实现人类知识的有效利用。它不仅对网格管理软件提出了技术要求,同时也对知识服务的理论和方法提出了挑战。受网格技术发展的影响,信息交流和知识创造作为科学研究活动的基础环节和基本形态,正发生着巨大的变化。
现代科学研究环境变化的基础特征是数字化和网络化。数字化基础上的分布式信息服务模式已经成为信息市场的主流模式,而且各种定制的个性化服务开始成为新的基础服务模式。在用户行为方面,通过网络数字化地获取科技信息已经逐步成为前沿科研人员的一种基本要求和行为习惯,且用户强烈地要求这种获取和利用不再是针对众多复杂的数据库或系统,而是形成逻辑整体的集成检索与利用。此外,用户信息活动的重点和瓶颈正从文献获取转变为知识发现,即对知识内容进行挖掘,根据其内在特征和价值进行鉴别、关联、重组,识别和创造新的知识。所有这些,将通过基于用户信息平台,按照个性化方式、集成整合多种信息资源和信息系统来进行。因而,需要对知识资源进行整合(如图3所示)。网格技术的发展已经从技术手段上为海量的文献信息管理深化到“知识单元”层次提供了实现的可能性。
3.个性化信息服务模式
个性化信息服务是指网络使用者可以按照自己的目的和需求设立网上信息的来源、内容特征、表现形式、特定服务功能等,以方便快捷地获取自己所需的网络信息内容,并对这些信息进行有效的管理。个性化信息服务将接受信息的控制权交到了用户手中。其服务方式可以是主动的,也可以是被动的。主动的个性化信息服务方式如果仅仅减轻了用户的体力劳动,则是一种非智能化的推送服务。如果同时也减轻了用户的脑力劳动,则是一种智能化的信息服务方式。智能化是个性化信息服务的发展方向,对公众具有巨大的吸引力。随着智能技术的不断完善和成熟,它必然会成为网站的主要信息服务方式。这种智能推送方式既可以通过改造现有的非智能化的信息推送服务来实现,也可以在传统的拉取方式中加入智能化的”推”来实现,具体方式便是开发和利用智能搜索工具。
网格技术的发展给数字化环境带来了丰富的、动态的网络信息资源,同时也呼唤新的检索机制与工具。虽然目前开发了不少搜索引擎,如GopherJewels、Yahoo、AhaVista、Infoseek、Excite等,但是用户仍然不能方便快捷地找到所需信息。用户在发出一个明确的查询请求后,返回的信息中往往有许多不相关的内容。可以采取两种方案解决这一问题:
(1)提供基于元搜索引擎的检索机制。所谓元搜索引擎,是分布于网络的多种检索工具的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作。元搜索引擎不像常用的搜索引擎那样拥有自己独立的数据库,而是更多地提供统一联结界面,或进一步提供统一检索方式与结果整理,形成一个由多个分布的、具有独立功能的搜索引擎构成的虚拟逻辑整体,从而实现对这个虚拟整体中各独立搜索引擎数据库的查询与数据处理。
(2)建立基于Push技术的信息检索系统。Push技术通过它的信息代理机制,在用户初次使用时设定所需的信息后,能够把网上相关信息用推送或网播的方式送到用户面前。Push技术为网格技术带来了重大的变革,使网络信息流不再是单一的“拉”,还包括反方向的“推”,从而使用户避免了网上漫无边际的查找与长时间的等待,极大地提高了信息检索效率。
参考文献
1 王妙娅,商业网站面向我国公众的个性化信息服方式.情报科学,2005,23(3):287—291
2 孙辉,徐学文.关、欧网格技术发展现状分析与思考情报理论与实践,2005,28(1):109—112
3 邓灵斌,数字图书馆信息服务模式研究.中国图书馆学报,2005,31(2):47—49,53
4 邓灵斌,东方.数字信息资源管理系统设计及其相关技术.中国信息导报,2004(7):36—38
5 胡宇峰.基于网格的资源共享技术体系分析.情报秆字,2004,22(1):119—122
6 李亮先.网格技术在数字图书馆的应用.情报科学,2004,22(6):703—706
7 王丽华.基于网格技术的虚拟图书馆.情报科学,2004,22(4):482—487
8 刘鹏.对网格技术应用的分析.http://indus—try.ccidnet.com/pub/article/c35_a97620 p1.html
9 钱德沛.网格技术与信息化建设.http://WWW.eb-world.com.cn/html/2004—5—25/2004525102710.asp
10 王晨.基于网格的WebServices.情报理论与实践,2004,27(1):77—80
11 张云涛等.基于网格的信息系统.情报杂志,2004(1):83—84
12 温有奎,赖伯年.网格技术将推动知识管理革命.情报学报,2004,23(1):124—128
13 焦玉英,李进华.论网格技术及其信息服务的机制.情报学报,2004,23(2):225—230
14 张晓林.构建数字化知识化的信息服务模式.津图学刊,2003(6):13—16,80
15 何绍华,师艳.成本效益驱动下的信息服务模式分析.情报科学,2005,23(3):329—333
16 I Foster.The Grid:A New Infrastructure for 21st Cen· tury Science.Physics Today,2002,55(2):42—47
17 Tuecke S, etc.Grid Service Specification.Open Grid Service Infrastructure WG,Global Grid Forum, Draft2.http://www.gridforum.org/ogsiwg/drafts/ GS_Spec_Draft03_2002—07—17.pdf
18 Ferguson,Chris.‘Shaking the conceptual foundmion,’ too:Integrating research and technology support for the next generation Of information service.College&Re— search Libraries,2000,61(4):300—311
(作者单位:南华大学经济管理学院 湖南衡阳421001)
一、网格技术在数字信息服务中的应用
实现网格技术在信息服务中应用的关键在于网格管理软件。网格管理软件实际上是更高层次的网格操作系统,其核心技术主要是一体化的信息平台(单一系统映象)、语义网站(Web)、智能代理和知识本体技术等。信息服务网格所提供的服务包括文件消息、计算、信息内容、事务处理和知识服务等,因此信息服务网格可大致分为计算网格、信息网格与知识网格。其中,计算网格提供原始计算能力、高速宽带和数据处理。要实现上述功能,必须与网络连接,并具有浮点计算和逻辑数据处理能力。信息网格采用接口连接主要的信息资源,允许同质对非同质分布信息进行访问。信息网格也需要高级分析以减少得到各种形式的信息所带来的技术的复杂性。知识网格使用基于知识的方法学和技术学,包括知识工程工具、智能软件代理、数学建模、模拟、计划等。知识网格也应对决策制定和假设产生提供智能指南。存储在知识网格中的信息资源应允许支持低层信息和数据的挖掘。来自网格层的知识应能控制计算层中的数据获取。
数字信息服务方式的变革将是网格技术直接应用的结果,特别是对于对等计算技术的关注,反映了数字信息服务系统对于高效率、低成本和高可靠性的基础技术环境的需求。对等计算和对等网络,简单地说就是计算机系统间通过网络的直接数据交换实现计算机资源和服务的共享,这些资源和服务包括信息交换、处理能力、高速缓存、备份设备和文件磁盘空间等。对等计算环境具有可以降低计算成本、提高可扩展性、便于工作组间的协调和分布式计算等优点。为了更好地实现各个子系统之间、人与资源之间的交互操作,需要基于本体建立统一的语义描述,应用XML语言作为网上数据交换标准,进而给予统一描述的知识实现系统互操作。基于网格技术的层次化数字信息服务体系结构(见图1)由以下6个部分组成:
1.数据网格与计算网格
它们是数字信息服务平台的基础组成部分。数椐网格可以集成多种异构、分布的数据源,进而为海量数据的存储、传输、处理与融合提供基础框架。计算网格由多个服务器集群构成,是大型、分布式系统的自然延伸,通过集群技术将多个单位的服务器融合成一台透明的、功能强大的“高性能计算机”,用于提供高性能计算服务。
2.信息资源网格
它基于数据网格和计算网格构建,是数字信息服务平台的重要组成部分。该层对于来自数据网格的数据和计算网格的计算结果进行处理,进而形成信息资源,并将其提供给服务网格层。
3.服务网格
它是数字信息服务系统的核心组成部分和主要功能单元。服务网格提供数字信息服务系统所支持的各种服务,同时对于各个部门的应用系统提供服务支持,这种服务支持包括信息、知识、计算和智能信息处理服务等。服务网格提供的服务大多是单台计算机或单个子系统无法提供的服务,如协作计算、大规模实时多媒体应用等,同时可用于建立虚拟环境,使不同组织的人、系统可以协同和交互。
4.系统建模与应用模板
它们根据来自应用系统和个性化信息服务访问接口的不同要求,相应地生成专有的系统模型和应用模板。服务网格根据其所生成的系统模型和应用模板,向应用系统或用户提供符合其要求的服务。
5.个性化信息服务访问接口
它是数字信息服务平台的重要功能单元,是信息服务平台通用性、交互性、实时性的重要表现部分。针对读者的不同应用需求,数字信息服务平台各个应用子系统通过该接口可以很好地与数字信息服务平台进行交互,进而获取“量身订制”的个性化服务。
6.开发规范与管理控制平台
它是数字信息服务平台的中央控制单元,通过该平台的集中统一控制,使得新建的数字信息服务平台子系统及服务网格、信息网格、数据网格和计算网格的各个子系统符合统一的规范,利于实现系统间的互通、互联和互操作,进而在管理控制平台的统一控制、协调下发挥出最优化的效用。
二、基于网格技术的:数字信息服务模式
1.信息集成服务模式
信息集成服务是一个现代化的信息服务概念,是对信息资源、技术资源和人力资源进行融合的过程,是分布式服务的飞跃。集成服务一定要面向用户、面向任务,有明确的目标或主题。
网格最早是以集成异构计算平台的身份出现,接着跨入分布式海量数据处理领域,并将在信息集成领域一层身手。所谓信息网格,就是要通过统一的信息交换架构和大量的中间件,向用户提供“信息随手可得”式的服务。信息网格研究的中心问题有如何描述信息、存储信息、发布信息和查找信息;如何将异构平台、不同格式、不同表述方式的信息进行转换,实现信息的无障碍交换;如何充分利用现有网络技术,如HTYP、XML、WSDL、UDDI、SOAP等,构成一个完整的服务链;信息的语义表示,即如何赋予信息内涵,以及如何避免信息的二义性;如何对信息加密、防止信息泄露等等。
数字信息集成服务模式就是对具有差异性、分布性、管理的自治性的数字信息资源、技术、人员、机构与服务功能进行集成,实现对分散的数字信息资源系统的有效控制,使用户得到动态的并在时间和空间上一致面向问题的全方位、多层次、多元化的信息服务,从而构建数字信息面向用户的高效能、综合化的信息集成服务体系。它以信息服务内容与产品的集成为目标,以功能的集成作为结构,以平台的集成作为技术的基础,以人的集成作为根本保证,最终形成统一的检索平台、一次性用户认证、不同系统之间的无缝链接和完整的集成化数字信息服务综合平台体系。其服务模式如图2所示。
可以预见,信息集成将是网格最有可能流行起来的应用方向。2004年1月20日,Globus联盟、IBM、和HP等联合发布了新的网格标准草案WSRF(Web Se~ices Resource Frame·work),把OGSI转换成了6个用于扩展WebSe~ices的规范。这时,网格服务已经与Web服务彻底融为一体。这标志 着网格已经调整好方向,将信息集成作为第一目标。数字信息服务模式的发展趋势应当朝着一种面向用户的,资源系统、服务系统与用户信息利用系统聚合在同一信息空间的、智能化的集成信息服务模式的方向发展。
2.数字化知识服务模式正在兴起的网格技术,为人们对知识信息的需求由文本单元向知识单元深度发展提供了实现的可能性,同时也要求人类采用新的知识组织方式来建立知识管理的大平台。它将改变人类知识生产、知识传播、知识创新、知识分配的传统方式。网格技术将会给知识服务带来革命,并将引发知识管理学的诞生。构建网格的目的在于实现人类知识的有效利用。它不仅对网格管理软件提出了技术要求,同时也对知识服务的理论和方法提出了挑战。受网格技术发展的影响,信息交流和知识创造作为科学研究活动的基础环节和基本形态,正发生着巨大的变化。
现代科学研究环境变化的基础特征是数字化和网络化。数字化基础上的分布式信息服务模式已经成为信息市场的主流模式,而且各种定制的个性化服务开始成为新的基础服务模式。在用户行为方面,通过网络数字化地获取科技信息已经逐步成为前沿科研人员的一种基本要求和行为习惯,且用户强烈地要求这种获取和利用不再是针对众多复杂的数据库或系统,而是形成逻辑整体的集成检索与利用。此外,用户信息活动的重点和瓶颈正从文献获取转变为知识发现,即对知识内容进行挖掘,根据其内在特征和价值进行鉴别、关联、重组,识别和创造新的知识。所有这些,将通过基于用户信息平台,按照个性化方式、集成整合多种信息资源和信息系统来进行。因而,需要对知识资源进行整合(如图3所示)。网格技术的发展已经从技术手段上为海量的文献信息管理深化到“知识单元”层次提供了实现的可能性。
3.个性化信息服务模式
个性化信息服务是指网络使用者可以按照自己的目的和需求设立网上信息的来源、内容特征、表现形式、特定服务功能等,以方便快捷地获取自己所需的网络信息内容,并对这些信息进行有效的管理。个性化信息服务将接受信息的控制权交到了用户手中。其服务方式可以是主动的,也可以是被动的。主动的个性化信息服务方式如果仅仅减轻了用户的体力劳动,则是一种非智能化的推送服务。如果同时也减轻了用户的脑力劳动,则是一种智能化的信息服务方式。智能化是个性化信息服务的发展方向,对公众具有巨大的吸引力。随着智能技术的不断完善和成熟,它必然会成为网站的主要信息服务方式。这种智能推送方式既可以通过改造现有的非智能化的信息推送服务来实现,也可以在传统的拉取方式中加入智能化的”推”来实现,具体方式便是开发和利用智能搜索工具。
网格技术的发展给数字化环境带来了丰富的、动态的网络信息资源,同时也呼唤新的检索机制与工具。虽然目前开发了不少搜索引擎,如GopherJewels、Yahoo、AhaVista、Infoseek、Excite等,但是用户仍然不能方便快捷地找到所需信息。用户在发出一个明确的查询请求后,返回的信息中往往有许多不相关的内容。可以采取两种方案解决这一问题:
(1)提供基于元搜索引擎的检索机制。所谓元搜索引擎,是分布于网络的多种检索工具的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作。元搜索引擎不像常用的搜索引擎那样拥有自己独立的数据库,而是更多地提供统一联结界面,或进一步提供统一检索方式与结果整理,形成一个由多个分布的、具有独立功能的搜索引擎构成的虚拟逻辑整体,从而实现对这个虚拟整体中各独立搜索引擎数据库的查询与数据处理。
(2)建立基于Push技术的信息检索系统。Push技术通过它的信息代理机制,在用户初次使用时设定所需的信息后,能够把网上相关信息用推送或网播的方式送到用户面前。Push技术为网格技术带来了重大的变革,使网络信息流不再是单一的“拉”,还包括反方向的“推”,从而使用户避免了网上漫无边际的查找与长时间的等待,极大地提高了信息检索效率。
参考文献
1 王妙娅,商业网站面向我国公众的个性化信息服方式.情报科学,2005,23(3):287—291
2 孙辉,徐学文.关、欧网格技术发展现状分析与思考情报理论与实践,2005,28(1):109—112
3 邓灵斌,数字图书馆信息服务模式研究.中国图书馆学报,2005,31(2):47—49,53
4 邓灵斌,东方.数字信息资源管理系统设计及其相关技术.中国信息导报,2004(7):36—38
5 胡宇峰.基于网格的资源共享技术体系分析.情报秆字,2004,22(1):119—122
6 李亮先.网格技术在数字图书馆的应用.情报科学,2004,22(6):703—706
7 王丽华.基于网格技术的虚拟图书馆.情报科学,2004,22(4):482—487
8 刘鹏.对网格技术应用的分析.http://indus—try.ccidnet.com/pub/article/c35_a97620 p1.html
9 钱德沛.网格技术与信息化建设.http://WWW.eb-world.com.cn/html/2004—5—25/2004525102710.asp
10 王晨.基于网格的WebServices.情报理论与实践,2004,27(1):77—80
11 张云涛等.基于网格的信息系统.情报杂志,2004(1):83—84
12 温有奎,赖伯年.网格技术将推动知识管理革命.情报学报,2004,23(1):124—128
13 焦玉英,李进华.论网格技术及其信息服务的机制.情报学报,2004,23(2):225—230
14 张晓林.构建数字化知识化的信息服务模式.津图学刊,2003(6):13—16,80
15 何绍华,师艳.成本效益驱动下的信息服务模式分析.情报科学,2005,23(3):329—333
16 I Foster.The Grid:A New Infrastructure for 21st Cen· tury Science.Physics Today,2002,55(2):42—47
17 Tuecke S, etc.Grid Service Specification.Open Grid Service Infrastructure WG,Global Grid Forum, Draft2.http://www.gridforum.org/ogsiwg/drafts/ GS_Spec_Draft03_2002—07—17.pdf
18 Ferguson,Chris.‘Shaking the conceptual foundmion,’ too:Integrating research and technology support for the next generation Of information service.College&Re— search Libraries,2000,61(4):300—311
(作者单位:南华大学经济管理学院 湖南衡阳421001)