论文部分内容阅读
本文的研究来源于导师的课题《教育云平台的运营和管理研究》。主要研究跟教育云服务平台相关的管理和运营关键技术问题。《教育信息化十年发展规划(2011-2020年)》[1]对于国家教育云服务平台建设工程描述如下:教育云服务平台提供各类教育资源、终身学习和教育公共信息服务的一站式服务,构建随时随地、人人可用的教育信息资源和学习环境。为了实现教育云的建设目标,在教育云平台上构建分布式、可管理、易检索的信息共享平台是亟待研究的关键技术之一,也是本文的重点研究方向。然而,在云计算环境下,海量服务的有效发布和快速发现并非易事。在服务发布环节,传统的集中式的UDDI服务注册中心存在一系列的问题。例如,在面临大规模的服务数据发布时,传统的集中式服务注册中心存在服务数据处理效率低的问题。在服务发现环节,传统的服务注册中心无法应对日益庞大的海量服务请求,急需采用新的方法提高响应速度。因此,本文作者采用了一种新的思路,利用云计算技术解决传统服务注册中心的这类问题。主要技术路线是采用Hadoop平台构建分布式服务注册中心,并通过WEB服务的语义描述及引入缓存机制两种方法提高对服务的检索效率。本文主要内容有:(1)在面临服务数据的剧增所带来的存储和数据处理问题上,本文对已有的UDDI注册中心进行了分布式扩展,设计了一个构建在Hadoop平台上的服务注册中心,以HBase作为数据的持久层,将HBase中的服务数据模型映射到UDDI的数据结构中。利用HBase和MapReduce计算框架提供的大规模数据的并发存储和处理能力,提高服务注册中心的数据处理能力。本文作者对其所设计的新分布式服务注册中心起名为HUDDI。(2)在所设计的HUDDI中,引入语义的服务描述和服务质量的匹配以提高服务的查询效率,通过对热点服务的缓存机制进一步提高了作者所设计的基于Hadoop的分布式服务注册中心的查询效率,将改进平台命名为HUDDI+。(3)本文作者对HUDDI进行了编码的实现,并对设想进行了有效性验证。作者通过模拟数据实验,将HUDDI与JUDDI(传统的集中式UDDI实现)进行了比较,表明HUDDI在处理大规模的服务数据方面有较高的性能和稳定性。作者还通过模拟数据实验,将HUDDI与HUDDI+进行了比较,表明采用热点机制的HUDDI+在查询效率方面有进一步的改进。(4)结合北京交通大学数据中心建设项目,对本文设计的服务注册中心实际应用,将数据中心的数据服务发布到]HUDDI+。