LAV数据集成系统的查询处理

来源 :复旦大学 | 被引量 : 0次 | 上传用户:Shan417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式数据集成系统连接物理或逻辑上分布于不同位置的数据源,向用户提供对这些数据源的一个综合全面的全局视图,同时负责对这些数据源的自动访问和访问结果的集成。 分布式数据集成具有广泛的应用前景,例如因特网上商务信息的集成,集成各个政府部门信息的面向公众的电子政务系统,企业之间以及企业各部门之间的信息共享和协作都需要数据集成。 数据仓库、对等(peer-to-peer)结构以及中介器结构都可以用于实现分布式数据集成。本文以中介器结构数据集成为背景,重点研究了实现中介器上查询处理的若干关键问题。作为后续内容的基础,本文首先介绍了构成数据集成系统基本结构的全局数据模式、基于这个全局模式描述的每个数据源局部模式。随后的内容在以下几方面展开。 1.基于数据源的查询重写:本文的数据集成系统采用LAV方式,数据源被描述为基于全局模式的视图,因此可以通过查询重写技术构造对全局查询的处理过程。查询重写技术来源于利用实化视图(Materialized View)处理查询的需要。其算法复杂性包括构造视图与查询之间的变量映射和组合这些变量映射这两个相互独立的NP完全问题,现有算法往往通过简单的枚举检查所有可能的变量映射和这些映射的所有组合,其结果是需要做很多无效或冗余的检查和计算。本文针对这两个问题提出了在实现中的优化方法,在构造视图与查询之间的变量映射关系时限定只产生不被包含的映射,并且提出一种方法在特定情况下可以利用Bachman图按唯一的计算顺序构造出所有不被包含的映射。在组合各种映射构造查询重写阶段,本文提出的算法避免了对所有可能的映射组合的构造,而只组合和检查能够覆盖当前查询所有子目标的查询重写。此外,本文还针对数据源具有查询能力约束或某些语义约束的情况改进了有关的算法。 2.查询优化:分布式数据集成系统查询优化的目标与集中式数据库有所不同。本文从降低网络数据流量和提高查询响应速度两个方面研究优化问题。首先,在安排多个联接操作的顺序方面,本文证明了以降低网络数据流量为优化目标时只需要考虑线性联接树构成的联接顺序,但如果以提高查询响应速度为目的,则需要同时考虑包括灌木型树在内的所有联接顺序,并提出了相应的算法。其次,在实际环境中,数据源以及网络的性能在一定程度上是动态变化的,静态的查询计划很难适应,但以往的研究几乎都忽视了这个问题。而本文则提出了直接把联接计划的构造策略结合到查询执行过程中的方法,能够根据网络的当前状况动态调整联接操作的执行顺序。最后,为了优化选择操作,本文提出了在数据源之间分配选择条件的方法,能够尽量多地利用数据源本地的处理能力以降低网络数据流量和提高查询响应速度。 3.构造datalog程序处理查询:在开放世界假设下,为了得到尽量多的查询结果并避免对相同数据源的重复访问,一个更好的方法是把
其他文献
(本刊讯)为了进一步促进社会组织公益成果转化,激发新的创造活力和发展动力,根据《第三届北京市社会组织公益服务品牌评选工作方案》要求,经申报、推荐、初审、评委投票、综
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:比较艾司西酞普兰和西酞普兰对患者抑郁症的临床疗效与安全性。方法:选取2016年1月—2017年10月间就诊的抑郁症患者92例资料,采用随机分配原则将其分为对照组和观察组,
珠算课是一门操作性比较强的课程,要想使学生熟练掌握加、减、乘、除等各种运算,选到定级或比赛的目的,除了掌握基础理论知识之外,还应在技能、技巧、心理等方面多加训练。那么,究
解构主义是对结构主义的解构,是反逻各斯中心主义(logocentrism)。解构主义作为一个新兴的理论体系渗透于各个领域,翻译领域也不例外。本文通过解读凯瑟琳?戴维斯(KathleenDavis)的
最近,一项研究发现,人脑在一生中都可产生新的神经元,包括老年时期,从而否定了一个普遍相信的观点:人出生后脑细胞就不再增加,不再产生新的神经元,因而疾病和创伤引起的脑细
斯蒂芬·金,美国当代恐怖小说家,他笔下的一些梦魇般的场景常令读者毛骨悚然。然而,有趣的是,在他自己的生活中,斯蒂芬也经常被一个恐怖的梦魇所扰:他正在一个燥热狭窄的
<正> 我们在珠算的实用中,往往经常遇到一些二个或几个相同的数字,如55、303、888等。这些数都叫做随数,只要计算出一个同数与被乘数的积,其他数就不必计算而跟随加入,采用随
我校是一所文理兼备的综台性省属粮食中等专业学校。珠算作为一门计算技术是经济管理类专业的专业基础课。珠算教学质量的高低.直接影响到学生专业课的学习、智能的发展和业务
工程项目控制系统是决定工程项目成败的三大要素之一,项目定义(Project Definition)则是工程项目控制系统的首要环节。针对我国目前在大型基础设施工程建设控制领域普遍存在