论文部分内容阅读
近十年来,计算机网络迅猛发展,同时网络的使用也逐渐增加,信息的数量、种类和分布都达到了一种“爆炸式”的增长。如何存储、分发、组织和管理、高性能处理、分析和挖掘海量分布数据成为许多应用的首要问题。数据网格技术的发展为解决这个问题提供了一条有效的技术途径。它通过开发能够集成网络上分布的多个数据集等资源,形成单一虚拟的数据访问、管理和处理环境,为用户屏蔽底层异构的物理资源,建立分布海量数据的一体化数据访问、存储、传输、管理与服务架构。
其中,松散耦合的Web服务成为为用户屏蔽底层异构的物理资源这个问题的首选。Web服务与数据网格结合形成网格数据服务。于是,对网格数据服务的有效管理变得越来越重要。传统上是对UDDI进行扩展来实现网格数据服务的描述、发现和集成,或者直接使用OGSI-DAI实现。但是由于UDDI和OGSI-DAI采用集中的方法,有其局限性,因此出现了管理网格数据服务的新方法——P2P(peer-to-peer)方式。P2P方式作为一个彻底的分布式计算模型,与集中的服务器方式相比,具有一些优势,如避免了单点失败,可扩展性好等。
本文,首先对已有的P2P结构和算法进行了深入分析和讨论,提出了基于Hilbert曲线的服务放置空间这一概念,并结合现有的Chord算法进行改进,提出将Hilbert曲线融入Chord环中形成一种新的改进结构-HilbertChord环。它是一种基于Hilbert曲线结构的Chord系统,为网格数据服务的模糊查询提供了很好的支持。系统的构架使用DHT来建立,同Chord环构建网络拓扑相似,但关键区别在于映射服务的方式是将服务映射成一条Hilbert曲线。系统首先使用类似{多个关键字,网格服务URL}来描述某一具体的网格服务,然后将这一系列关键字哈希成一组数字,将这一组数字作为该服务在空间中的一点坐标,再用Hilbert曲线将所有的点连接起来进行降维,通过Hilbert函数计算出服务点的曲线长度,使一个服务就被描述成一段线段的长度,即用线段的长度来表示特定服务,再将Hilbert曲线转变成一个Chord环,从而将服务转变成线段长度映射到节点上。应用了该结构的数据网格系统,除具有一般数据网格的特点外,还有更高的分布性和可靠性、查全率和查准率,实现对网格数据服务的更有效管理。
在此基础上,每个服务描述文件再维护一个相似服务信息表,表中仅记录在hilbert空间与其相邻的服务的Hilbert曲线长度。这样在保证了查准率的基础上满足了对于网格数据服务的相似查询。通过实际验证,本文所提出的数据网格环境下,支持分布式网格数据服务的HilbertChord结构是可行的,达到了预期的目标。