基于本体的半结构化数据集成研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:chrisliuyaqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的发展,信息来源种类的增多,信息复杂性的增加,传统的数据存储和交换方式已经不能够满足实际应用和研究的需要,XML作为半结构化数据存储和交换的标准,正在被广泛的应用,而对于半结构化数据源的集成也日益成为研究的热点.对于基于XML的半结构化数据源的集成不同于传统的数据库集成,XML的树型层次模型不同于扁平的实体对象模型,因此不能用传统的基于数据库视图的集成方法.XML模式具有层次结构和约束关系,在数据模型中包含一定的结构信息,因此研究者提出了基于全局模式和局部模式的集成方法,通过在模式之间建立映射关系,将基于全局模式的查询转化为基于局部模式的查询,映射根据粒度可以在部分模式之间,路径之间,或者标签之间建立,基于模式映射的方法能够较好的解决部分应用范围的集成问题.因为模式是一个纯语法结构,对于复杂模式间的映射和查询通常较复杂,为了解决模式集成中的一些问题,该文提出一种基于本体的数据集成方案,可以看作是对模式集成方法的一种拓展,主要贡献在于提出一种语义驱动的查询建立模型,一种本体与数据源模式的映射模型和基于此模型的查询分解算法,以及针对数据源的查询语言转换算法.基于本体的集成方法是一种自上而下的集成过程,与模式集成相比本体是一个有向图结构,没有根节点,每一条边都具有对应的语义,查询树可以从任意节点建立,基于本体和映射规则的查询处理算法可以很好的将基于本体的查询转化为基于数据源的查询计划,并且具有较好的扩展性.最后通过一个原型系统来证明集成框架的功能性和可行性.
其他文献
数据挖掘又称数据库中知识发现,是从大量数据中用非平凡的方法发现有用的知识。分类是数据挖掘中的一项非常重要的任务,在商业、金融、电讯、DNA分析、科学研究等诸多领域具有
超立方体网络是迄今为止最为重要和最具吸引力的网络拓扑结构之一。本文通过对当前网络中的拥塞控制、流量控制和负载均衡等问题的深入研究,提出和设计了基于负载均衡的超立方
学位
中文版面(特别是中文报纸版面)中文本域与非文本域经常交错嵌入。非文本域对文本域的提取会造成干扰。针对这种特点,本文提出了一种非文本块优先的中文版面分析方法。首先提取
随着软件的复杂度和规模不断增长和扩大,业界对于软件的可重用性和可维护性的要求也越来越高。基于组件的软件具有较高层次的可重用性和高度的可维护性,因而成为了近年来软件开
供应链管理为企业提供了一种新的管理理念与模式,它所强调的快速反应市场需求、战略管理、高柔性、低风险、成本--效益目标等优势,吸引了许多学者和企业界人士研究和实践它,
随着多媒体数据的日益发展和普及,多媒体相关技术的研究成为当前信息领域的一个热点,特别是基于内容的图像检索(Content Based Image Retrieval,CBIR),形成了一类新的前沿课
随着计算机网络和Internet的快速发展,全球信息化已成为人类社会发展的大趋势,但由于计算机网络具有联结形式多样性和网络开放性等特征,致使网络容易受黑客恶意软件和其他不
随着互联网技术的快速发展,大量社交网站日益兴起。越来越多的信息暴露于网络当中,如果这些数据落到不恰当的人手中,轻则给人们的生活造成困扰,重则造成重大经济利益损失。因此,人
随着计算机动画、虚拟现实、科学计算可视化等技术的广泛应用,三维实时绘制技术逐渐成为计算机图形学的研究热点.虽然图形绘制技术经过了近四十年的发展,取得了长足的进步,但