基于XML的异构数据集成技术的研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:jj1385173
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化建设的深入和网络技术的发展,相当数量的企业积累了大量的存储在不同平台、依赖于不同数据库管理系统的数据和众多非结构化数据(如XML文档、文本文件等)。如何通过网络,将这些不同来源、不同格式的异构数据进行有效的集成,实现企业内部数据共享,使之在企业运行中发挥更大的作用,是企业信息化发展的必然需求。为满足这种需求,进行异构数据集成技术的研究非常必要。本文首先对现有的数据集成方法、XML技术、Web Services技术等异构数据集成理论和技术进行了研究,并在此基础上,采用Mediator/Wrapper中间件法,设计了一种基于XML的异构数据集成系统结构。在该系统结构中,使用XML Schema建立公共模型,以XML为数据交换格式,XQuery为全局查询语言,利用Web Services技术屏蔽数据源的运行环境差异,在中间层建立一个公共的集成环境。它屏蔽了各异构数据源的平台、系统环境、内部数据结构等方面的异构性,为用户提供了一个统一、透明的访问接口,实现对各异构数据源中数据的集成查询。其次,对该系统结构中每个模块进行了功能描述和设计,并对其关键模块的设计与实现进行了详细说明。设计实现了关系型数据库关系模式到XML Schema模式的转换方法,并建立该集成系统的公共模型。设计实现了查询处理器中基于公共模型的XQuery全局查询分解处理算法。通过将每个异构数据源封装为一个Web服务,实现了异构数据源的无缝集成,使系统具有低耦合、灵活、易扩展的良好特性。最后,本文应用上述系统结构,设计实现了一个学生信息查询系统实例,完成了包括结构化数据源和半结构化数据源在内的异构数据集成查询功能,实验结果表明本文设计的异构数据集成方案是可行的和正确的。
其他文献
随着数据仓库、决策支持等OLAP技术的广泛应用,数据库系统对执行引擎查询效率的要求越来越高,因此人们提出了一种的新的数据库系统设计理念,即以列为基本存储单位的列存储数
随着P2P网络技术的逐渐深入,P2P作为一种分布式网络技术在许多领域得以广泛的应用,尤其是针对资源共享。然而由于网络所存在的固有的安全性问题已成为制约P2P网络中资源共享
随着网络技术的不断发展,基于UDDI的传统的Web服务发现技术已越来越不能满足目前的需求。UDDI由于没有提供足够的语义信息,只能够进行基于关键字的服务查找,匹配精度不高。因
随着全球经济一体化,各个行业的竞争也越来越激烈。对于机械加工企业来说,如何提高生产率、产品质量和减少生产成本,成为企业关注的焦点话题,也成为企业生存的根本因素之一。
随着多媒体技术和网络的快速发展,图像信息资源大量增多,图像的有效管理和检索变得越来越重要。用户如何从海量图像数据库中快速而又淮确地检索出需要的图像,是目前研究的一
传统的信息检索技术往往是集中式的,随着数据量的指数增长,这种集中式的数据存放对于数据库的更新维护带来很大的难度,同时检索查询操作也变得非常费时,这造成了整个系统性能
话题识别与跟踪,作为一项旨在帮助人们应对信息过载问题的研究,以新闻专线、广播、电视等新闻媒体信息流为处理对象,将语言形式的信息流分割为不同的新闻报道,监控对新话题的
缓冲区溢出攻击是利用缓冲区溢出漏洞所进行的攻击。缓冲区溢出是指当计算机向缓冲区内填充数据时超过了缓冲区本身的容量,溢出的数据覆盖在合法数据上。缓冲区溢出是一种非常
图像数据包含着丰富的信息,但相应的数据量也非常大。因此,在实时应用中,对图像的检索具有了更高的要求。现有的基于内容的检索方式(CBIR),虽然检索效果相对较好,但需要对图
选举是当今公民实现民主的重要方式,相比于传统选举方式,电子选举以密码学为基础,可以有效避免在各个环节中出现徇私舞弊现象,并且通过使用高效的计算机来对选票进行最后的统