XML ToyBricks:一个Web环境下基于语义的动态XML数据集成工具的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:feiflymail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文设计实现了一套Web数据集成工具XMLToyBricks中,。首先,观察到Web环境下,用于交换的数据信息相当多的都是来源于关系型数据库或者是表现关系特性的数据。针对这种现象,设计了类似于关系代数的集成表达逻辑,使用了求并、连接、选择以及投影四种主要的关系运算;针对XML集成中普遍存在的语法、语义冲突问题,目前人们解决冲突的方法的开销比较大,认为可以在一个应用领域中,存在该领域使用的公共词汇,针对XML,将标签、属性或者标签属性组合的出现成为一个“XML场景”,通过列举公共词汇在集成环境中可能出现的“场景”,在XML解析过程进入该场景时能自动将来自数据源提供者的本地信息映射成为用公共词汇表达的全局信息,以解决语法异构的问题。这种处理语法异构的方法开销较小,但不能保证正确性,需要人工参与调整;针对语义冲突问题,将解决的责任交给人工,由自定义的数据处理过程来解决语义冲突,在工具框架内提供了方便处理链的发布的插口。XMLToyBricks将数据内容与XML格式分离,每个用户可以针对某类整合数据定制自己需要的结果格式,XMLToyBricks会根据此配置信息按照用户需要的格式返回XML结果。为了进一步提高效率,提高集成数据的可用性,XMLToyBricks使用了缓存,针对缓存管理,设计了初步的策略。
其他文献
随着计算机网络技术的不断普及和发展,越来越多的单位要求建立一个先进的网络信息系统。由于各个单位都有着自己行业的特点,因此所需要的网络系统千变万化。人们在面临网络技术
随着多媒体技术和网络技术的飞速发展,数字产品的应用越来越广泛。数字信息的安全问题逐渐成为了人们关心的问题,其中以数字作品的版权保护最为重要和紧迫。数字水印技术作为
本文首先讨论了嵌入式GIS系统国内外研发的历史和现状,介绍了嵌入式系统的一些背景知识,嵌入式系统下的移动资料的相关概念,移动计算环境、无线通讯的基本知识、嵌入式GIS技
近几十年来,科学技术取得了飞速的发展。由计算机技术所带来的信息革命使人类由工业化的社会进入到了信息化的社会。在众多信息中,图像信息是人类认识世界及人类自身的重要源
数字图像盲水印技术, 就是将水印信息秘密地隐藏于数字图像中, 隐密图像经网络传输后再从中提取或检测水印信息, 且无需参照原始载体图像。目前的盲水印技术存在很多问题, 例
网格是解决科学计算、工程计算和商业计算等大规模计算的平台。它是下一代互联网技术,把互联网合成一台巨大的超级计算机,从而实现资源的全面共享。在网格计算中,任务管理、
目前,Internet迅速普及,Web应用的复杂性和规模都在不断增加和扩大,呈现出高度灵活性、可靠性和个性化等特点,这就给Web应用开发带来了新的挑战。本文通过分析后认为,在现有的Web
空间数据挖掘(SDM)或空间知识发现,是从大量的空间数据库中抽取隐含的知识、空间关系或非显式存储在数据库中有意义的特征或模式。此技术在理解空间数据、获取空间与非空间数
随着计算机网络的普及,上网用户不断增多。一些热门网站的点击率每天超过一亿。用一台服务器为所有用户提供服务几乎是不可能的,所以,只有采用负载均衡技术在多个提供相同服务的
本文的工作是在北京大学网络实验室、北京大学计算语言所与北京大学一IBM创新研究院联合研发的天网知名度系统(Fame)中开展的。针对原有系统名人网页相关度评价中存在的问题,