论文部分内容阅读
一、网格、网格计算和数字图书馆
网格计算的先驱Ian Foster曾有这样的描述:“网格是构筑在因特网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。因特网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能更多更强,能让人们透明地使用计算、存储等其他资源”
网格计算是伴随着互联网而迅速发展起来的新型科学计算模式。这种计算模式利用互联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计算机”,其中每一台参与计算的计算机都是一个“节点”,整个计算系统是由成千上万个“节点”组成的“一张网格”,这种计算方式数据处理能力超强,能充分利用网上的闲置处理能力,并像电力一样随处可得。
目前,已有网格计算的成功典范,如1999年的SETI@HOME项目将分布于世界各地的200万台个人电脑组成计算机阵列,用于搜索射电天文望远镜信号中的外星文明迹象,在不到两年的时间里,完成了单机34.5万年的计算量。网格是高性能计算机、数据源、因特网三种技术的有机组合和发展,它与因特网相比具有高性能、一体化、知识生产、资源共享等技术优点。在知识生产的过程中,高性能计算机把从数据源(传感器、贵重设备、数据库、信息库等)得到的原始数据,通过特定的程序加工成信息和知识。网格可以自动地找到高性能计算机、程序软件和数据源。网格的硬件和软件技术能够把所有计算资源和信息资源联为一体,透明而且高效率地提供各种服务,从而为数字图书馆建设奠定了坚实的基础。
数字图书馆是以知识概念体系为支撑的一种信息服务和知识服务环境,也是重要的社会信息基础设施之一。目前,数字图书馆的研究主要集中在数字内容的组织、管理、存储和检索等方面。
二、基于网格的数字图书馆技术线路
1.层次结构
网格作为一个平台,在不改变现有资源实体的基础上,构建数字图书馆,其包含的因素有网格节点、数据库、网格设备、可视化设备、主干网络、网格软件等。其中网格中间件提供远程进程管理服务、资源分配服务、存储访问服务、信息服务、安全控制服务、QoS等核心功能。
数字图书馆的网格模型如下:
在上图所示的层次结构中,每一层都定义了相关的协议,提供对服务的访问,包括馆藏数字化资源管理、数据存储、馆藏数字化资源访问等。在每一层将API/SDK定义为执行特定活动交换协议信息的具体实现。目前,各层都有通用的协议出现,且得到了很好的应用。因此,数字图书馆的建设可在遵照业界标准接口的基础上,立足于应用的实现。
2.面向数字图书馆应用的网格服务
系统的异构性是构建数字图书馆、实现信息资源全面整合的突出问题,可采用CORBA、Z39.50等技术手段来解决异构系统的互连互通。
目前,比较典型的解决方案是利用XML作为数据的传送格式,允许服务提供者和服务客户经过防火墙在Intrnet上进行通信,基于HTTP、XML、RPC的SOAP实现平台与环境的无关性和独立性。Web服务的构想是在不同的系统之间实现”软件—软件调用”,实现基于Web无缝集成的目标”。网格技术和Web服务已经是科学与工程计算广泛接受的网格技术解决方案。网格连接物理上分散的服务器、存储设备等软硬件资源,在作为操作系统的网格中间件的作用下,形成虚拟计算组织,用户可以在全球任何地方访问所需的资源,从而使计算资源得到充分的共享,而Web服务则是企业电子商务应用的集成,以企业应用为背景,Web服务是基于网格之上的。网格为Web服务提供了一个与硬件无关的虚拟计算机,而Web服务是构架在虚拟计算机平台上的,与平台/语言无关的应用交互集成平台。目前的Web服务开发平台包括J2EE、NET等。如下图所示。
数字图书馆的构建将利用SOAP、WSDL、WS—Inspection、UD-DI:XML来实现广泛的命名服务、仓储服务、索引服务、馆藏服务以及用户接口等通用框架要素。在OGSA中网格服务的定义是,网格服务是一种Web服务,该服务提供了一组接口,这些接口的定义明确并且遵守特定的惯例,解决服务发现、动态服务创建、生命周期管理、通信等问题,在OGSA中,将一切都看成是网格服务,因此网格就是可扩展的网格服务的集合,网格服务可以从不同的方式聚集起来满足虚拟组织的需要,虚拟组织自身也可以部分地根据它们操作和共享的服务来定义。因此,数字图书馆用户的多方面需求可以通过网格服务的方式提供。
3.需要解决的课题
基于网格的数字图书馆应从技术兼容性等方面考虑,解决多方面特殊的问题,如体系结构,移动应用,数字图书馆相关代理;分布式异构数字馆藏存取:互操作性,海量存取,相关信息发现、元信息集成;信息检索和数据挖掘:文本和多媒体信息检索新技术,数据挖掘,跨语种、多语种数据有取和检索,用于信息检索的机器翻译和机器学习;信息组织和内容管理:元数据,语义Web,本体,主题图;人机交互:界面,可视化,门户,个性化;数字图书馆领域相关技术标准、协议及其实现策略;网格技术与数字图书馆;电子出版等”。
三、未来发展应重视的几个问题
1.政府、企业、市场的协调
数字图书馆的建设不仅仅是考虑技术手段的选择,更多地应着眼于数字图书馆的发展战略、建设机制、核心标准规范体系等,涉及数字化加工、资源描述、资源组织、资源互操作、资源服务、内容编码、数据通信、计算机系统、安全管理等方面。
另外,数字图书馆的协调、稳定发展离不开电子商务中网上定购、付费浏览、网上赠与等的实现,数字产品的知识产权、著作权保护等问题的全面解决尚待时日””。同时,其对传统图书馆的业务管理模式、工作机制的改造和重组,相关标准和规范的制定,图书馆员的工作方法和工作定位等都提出了挑战,也必然存在诸多矛盾。政府部门也应逐步完善相关法律,加强指导,规范行为。
总之,数字图书馆的发展需要政府、企业、市场等各方面力量的推动,法律、技术和管理手段并重。以市场为驱动,以用户为主导,在保障用户权益的基础上,使信息流各方面得到合理的权益均衡,充分达到资源和服务的可使用性、可操作性、可持续性。
2.网格技术仍需深入研究和完善
网格技术思想的提出、目标定位以及市场对网格的宣扬,使针对网格的研究项目、应用项目发展如火如荼,但关于网格的研究国内外均刚刚起步,实现该技术的标准化、实用化、产业化的过程可能还需要更多的投入,通过不断的理论研究和应用实践来进一步完善。
3.技术融合
数字图书馆的建设首先要体现“以人为本”的思想,满足用户多元化、多层次的需求。基于网格技术构筑涵盖理、工、农、医各学科各类型科技文献,科学数据,多媒体信息,科技动态信息的数字图书馆,将有力促进科技文献、科学数据、多媒体信息的增量与存量资源的开发利用,推动科学数据、科技文献的共享和提高人口素质和社会文明。此外,网格技术本身与人工智能、机器学习、知识工程、基于内容的图像检索、多媒体检索、智能信息推拉技术、推荐服务和知识决策服务相互融合,用于信息查询、采编、导航、过滤、整理、发现等工作,使数字图书馆真正成为在线的知识源、跨语言全球性的知识库。
网格计算的先驱Ian Foster曾有这样的描述:“网格是构筑在因特网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。因特网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能更多更强,能让人们透明地使用计算、存储等其他资源”
网格计算是伴随着互联网而迅速发展起来的新型科学计算模式。这种计算模式利用互联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计算机”,其中每一台参与计算的计算机都是一个“节点”,整个计算系统是由成千上万个“节点”组成的“一张网格”,这种计算方式数据处理能力超强,能充分利用网上的闲置处理能力,并像电力一样随处可得。
目前,已有网格计算的成功典范,如1999年的SETI@HOME项目将分布于世界各地的200万台个人电脑组成计算机阵列,用于搜索射电天文望远镜信号中的外星文明迹象,在不到两年的时间里,完成了单机34.5万年的计算量。网格是高性能计算机、数据源、因特网三种技术的有机组合和发展,它与因特网相比具有高性能、一体化、知识生产、资源共享等技术优点。在知识生产的过程中,高性能计算机把从数据源(传感器、贵重设备、数据库、信息库等)得到的原始数据,通过特定的程序加工成信息和知识。网格可以自动地找到高性能计算机、程序软件和数据源。网格的硬件和软件技术能够把所有计算资源和信息资源联为一体,透明而且高效率地提供各种服务,从而为数字图书馆建设奠定了坚实的基础。
数字图书馆是以知识概念体系为支撑的一种信息服务和知识服务环境,也是重要的社会信息基础设施之一。目前,数字图书馆的研究主要集中在数字内容的组织、管理、存储和检索等方面。
二、基于网格的数字图书馆技术线路
1.层次结构
网格作为一个平台,在不改变现有资源实体的基础上,构建数字图书馆,其包含的因素有网格节点、数据库、网格设备、可视化设备、主干网络、网格软件等。其中网格中间件提供远程进程管理服务、资源分配服务、存储访问服务、信息服务、安全控制服务、QoS等核心功能。
数字图书馆的网格模型如下:
在上图所示的层次结构中,每一层都定义了相关的协议,提供对服务的访问,包括馆藏数字化资源管理、数据存储、馆藏数字化资源访问等。在每一层将API/SDK定义为执行特定活动交换协议信息的具体实现。目前,各层都有通用的协议出现,且得到了很好的应用。因此,数字图书馆的建设可在遵照业界标准接口的基础上,立足于应用的实现。
2.面向数字图书馆应用的网格服务
系统的异构性是构建数字图书馆、实现信息资源全面整合的突出问题,可采用CORBA、Z39.50等技术手段来解决异构系统的互连互通。
目前,比较典型的解决方案是利用XML作为数据的传送格式,允许服务提供者和服务客户经过防火墙在Intrnet上进行通信,基于HTTP、XML、RPC的SOAP实现平台与环境的无关性和独立性。Web服务的构想是在不同的系统之间实现”软件—软件调用”,实现基于Web无缝集成的目标”。网格技术和Web服务已经是科学与工程计算广泛接受的网格技术解决方案。网格连接物理上分散的服务器、存储设备等软硬件资源,在作为操作系统的网格中间件的作用下,形成虚拟计算组织,用户可以在全球任何地方访问所需的资源,从而使计算资源得到充分的共享,而Web服务则是企业电子商务应用的集成,以企业应用为背景,Web服务是基于网格之上的。网格为Web服务提供了一个与硬件无关的虚拟计算机,而Web服务是构架在虚拟计算机平台上的,与平台/语言无关的应用交互集成平台。目前的Web服务开发平台包括J2EE、NET等。如下图所示。
数字图书馆的构建将利用SOAP、WSDL、WS—Inspection、UD-DI:XML来实现广泛的命名服务、仓储服务、索引服务、馆藏服务以及用户接口等通用框架要素。在OGSA中网格服务的定义是,网格服务是一种Web服务,该服务提供了一组接口,这些接口的定义明确并且遵守特定的惯例,解决服务发现、动态服务创建、生命周期管理、通信等问题,在OGSA中,将一切都看成是网格服务,因此网格就是可扩展的网格服务的集合,网格服务可以从不同的方式聚集起来满足虚拟组织的需要,虚拟组织自身也可以部分地根据它们操作和共享的服务来定义。因此,数字图书馆用户的多方面需求可以通过网格服务的方式提供。
3.需要解决的课题
基于网格的数字图书馆应从技术兼容性等方面考虑,解决多方面特殊的问题,如体系结构,移动应用,数字图书馆相关代理;分布式异构数字馆藏存取:互操作性,海量存取,相关信息发现、元信息集成;信息检索和数据挖掘:文本和多媒体信息检索新技术,数据挖掘,跨语种、多语种数据有取和检索,用于信息检索的机器翻译和机器学习;信息组织和内容管理:元数据,语义Web,本体,主题图;人机交互:界面,可视化,门户,个性化;数字图书馆领域相关技术标准、协议及其实现策略;网格技术与数字图书馆;电子出版等”。
三、未来发展应重视的几个问题
1.政府、企业、市场的协调
数字图书馆的建设不仅仅是考虑技术手段的选择,更多地应着眼于数字图书馆的发展战略、建设机制、核心标准规范体系等,涉及数字化加工、资源描述、资源组织、资源互操作、资源服务、内容编码、数据通信、计算机系统、安全管理等方面。
另外,数字图书馆的协调、稳定发展离不开电子商务中网上定购、付费浏览、网上赠与等的实现,数字产品的知识产权、著作权保护等问题的全面解决尚待时日””。同时,其对传统图书馆的业务管理模式、工作机制的改造和重组,相关标准和规范的制定,图书馆员的工作方法和工作定位等都提出了挑战,也必然存在诸多矛盾。政府部门也应逐步完善相关法律,加强指导,规范行为。
总之,数字图书馆的发展需要政府、企业、市场等各方面力量的推动,法律、技术和管理手段并重。以市场为驱动,以用户为主导,在保障用户权益的基础上,使信息流各方面得到合理的权益均衡,充分达到资源和服务的可使用性、可操作性、可持续性。
2.网格技术仍需深入研究和完善
网格技术思想的提出、目标定位以及市场对网格的宣扬,使针对网格的研究项目、应用项目发展如火如荼,但关于网格的研究国内外均刚刚起步,实现该技术的标准化、实用化、产业化的过程可能还需要更多的投入,通过不断的理论研究和应用实践来进一步完善。
3.技术融合
数字图书馆的建设首先要体现“以人为本”的思想,满足用户多元化、多层次的需求。基于网格技术构筑涵盖理、工、农、医各学科各类型科技文献,科学数据,多媒体信息,科技动态信息的数字图书馆,将有力促进科技文献、科学数据、多媒体信息的增量与存量资源的开发利用,推动科学数据、科技文献的共享和提高人口素质和社会文明。此外,网格技术本身与人工智能、机器学习、知识工程、基于内容的图像检索、多媒体检索、智能信息推拉技术、推荐服务和知识决策服务相互融合,用于信息查询、采编、导航、过滤、整理、发现等工作,使数字图书馆真正成为在线的知识源、跨语言全球性的知识库。