半结构化数据集成系统中的查询处理研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:linxulong07
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来由于因特网和电子商务的高速发展,企业可获取的信息数量和类型有了极大的增长;万维网上可用信息资源的爆炸式增长也给信息的访问带来了新的挑战。数据集成的研究就是在这两种需求之下产生并不断发展的。 数据集成就是如何组合存在于不同数据源的数据,并且以一个统一的视图提供给用户使用的问题。研究者们在数据集成领域取得大量的研究成果;但是这个研究领域是如此的丰富,加之总有新的技术与它结合,所以仍有大量的问题期待人们解决。实际上,近十多年,关于数据集成的研究从未停止过。由于数据的访问多以查询的方式进行,而数据集成系统往往有多个底层数据源,它们被描述为全局模式上的视图,所以,数据集成系统的查询处理问题是数据集成研究的核心问题之一。另外,Web数据也导致了半结构化数据的研究。 本文研究的问题集中于半结构化数据集成系统的查询处理,主要研究了两个问题:OEM(Object Exchange Model,对象交换模型)半结构化数据集成系统中基于TSL(Tree Specification Language)查询语言的最大查询重写问题以及基于本体的XML集成系统中最大查询执行方案的生成以及优化问题。 在第一个方面,在基于TSL查询语言的OEM半结构化数据集成系统中,对于查询的包含和等价以及最大包含重写进行了形式化定义:在这种形式化框架下,提出了基于TSL查询的半结构化数据查询重写算法,其中应用了可伸缩的关系查询重写的MiniCon算法的思想;并且从理论上证明了算法的正确性。 在第二个方面,对于基于本体的XML数据集成系统进行了完善的形式化:在这种形式化框架下,提出了基于本体的XML集成系统中最大查询执行方案生成算法:引入了非完整性角色的概念,并基于非完整性角色对最大查询执行方案生成算法进行了优化;另外文章还提出了查询执行方案网络代价优化算法。理论上也证明了算法的正确性。 本文的工作基于国家自然科学基金项目——电子图书馆的相关关键技术开展。在这个项目中,作者参与了互操作接口及查询处理的设计分析工作,文章研究的问题正是在这些工作积累的基础之上完成的。
其他文献
针对“道桥测量工程”课程体系现状,分析了课程教学中存在的问题与不足,给出了调整整合教学内容、合理运用教学方法、改革考核方式,认为应重视“教”与“学”的统一,强化过程考核
骨重构是一个破骨细胞介导的骨吸收和成骨细胞介导的骨形成相互作用的动态平衡过程,近年来研究发现,由脂肪组织分泌的分泌型卷曲相关蛋白-5、脂联素、瘦素、抵抗素、内脂素等
要说法国的宫殿、古堡,当然要首推世界著名的凡尔赛宫,它是人类艺术史上一颗璀璨明珠。无论是在朝霞辉映下,还是在夕阳返照里,远远望着这片金光闪闪的宏伟建筑,都会立刻产生
在高中的语文教学过程中,学生已经具备了一些语文学习的基础性知识,因此需要在作文方面提升学生的技能。作文在语文中处于非常重要的位置,但是要提升作文的课堂效率却非常困
在高性能计算机的研究当中,如何保证系统的可用性和应用的可靠性一直就是需要首要考虑的问题之一。机群以其高性价比和高可扩展性已经成为构造高性能计算机一种主要的方法,而节
更改Undo的次数一般:PowerPoint可以撤消的操作数的默认值是20次。有两条路径可以让你更改这个值。点击菜单“编辑”、“重复选项”、“编辑”、“最多可取消操作数”,或执
公共图书馆能够为广大的民众提供方便的读书场所和渠道,为人们提供一个优良的读书氛围,在阅读推广方面,公共图书馆比其他的一些组织开展阅读推广更加具有优势地位,物质保障更加强
随着空间数据库技术和地理信息系统(GIS)的不断发展和应用,空间推理的基础理论以及相应算法也在不断的创新和发展。目前空间推理主要分为拓扑关系推理、主方向关系推理和距离
本世纪90年代初,科学家研制出大脑驱动系统。在此领域的先驱是美国的一家实验室。他们的驱动系统可使用户仅凭意念去开动机器,如开关电灯、调电视频道、甚至开车。人的每个心