论文部分内容阅读
近年来,随着Internet的快速普及,出现了一种新型的分布式计算环境——基于Internet的大规模分布式计算。这种Internet计算环境与传统的分布式计算环境相比,除了具有异构性等共同特点外,还具有大规模、分散控制、动态性等特点。Internet计算环境的这些特点,要求各参与者能够以一种松散耦合的方式进行信息交互和协同工作。而发布/订阅(publish/subscribe,简称pub/sub)技术能够使得信息交互的双方在时间、空间和控制流三个方面都被完全解耦,因而是Internet计算环境下的理想选择。 然而,现有的pub/sub技术在表达能力、效率和可靠性等方面尚存在着较多的问题,不足以支持大规模的Internet计算环境。本文针对面向Internet计算环境的发布/订阅系统的关键技术进行研究,以使得发布/订阅系统能够成为适用于Internet计算环境的通用、高效、可靠的分布式计算基础设施,从而为Internet计算环境提供一种强大的中间件支持。 本文首先提出了一种新型的发布/订阅系统数据模型,以支持Internet环境下的异构事件。我们将语义Web技术引入pub/sub系统中,利用本体来表示系统的概念模型,利用RDF图来表示事件,利用RDF图模式来表示订阅条件,以解决事件的语义异构和结构异构问题。当事件被发布时,系统首先将其转换成RDF结构,然后再进行进一步的处理。对于Map格式的事件,我们提出了一种基于事件结构描述(Event Schema)的转换方法,通过对系统中原有的事件结构描述加以扩展,以加入转换所必须的信息。对于XML格式的事件,我们提出一种基于XML Schema和XSLT的转换方法。我们还讨论了原有pub/sub系统中的订阅条件如何用RDF图模式来表示,以及相应的转换算法。据我们所知,这是第一个同时支持语义异构和结构异构的事件的pub/sub系统方案。 基于这种新型的数据模型,本文提出一种高效的匹配算法。在基于Internet的大规模计算环境下,一般会有大量的参与者,同时它们之间的信息交互也非常频繁,因而对匹配算法的效率有着很高的要求。与已有的图模式匹配算法相比,本文提出的算法由于利用了RDF的特点以及我们对事件和订阅条件的一些限制,因此可以达到一个很高的匹配效率,能够满足面向Internet的pub/sub系统的需要。该算法的基本思想是将订阅图和事件图都分解成一系列弧的集合,然后以弧作为基本单位进行匹配,不同订阅图中的相同弧只需匹配一次。同时,以系统的概念模型为基础,建立订阅图中各弧的索引结构,并利用与或树(AND-OR tree)来记录所有这些弧的匹配方案,最后在这些与或树的基础上进行计算,以确定最终的匹配结果,从而避免了对事件图和订阅图的回溯,缩短了匹配所需的时间。 在面向Internet的pub/sub系统中,往往有较多的事件代理而且分布在世界各地,它们往往来自不同的组织,这就要求pub/sub系统的路由协议应当具有较强的容错能力和自组织(self-organization)特性。我们将对等计算(P2P)技术与oub/sub技术结合起来,提出了一种新型的路由协议。该协议一方面使面向