分布式数据库查询优化算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:chi421
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络和数据库技术的迅速发展,人们对数据库的要求越来越高。传统的集中式数据库一般都被放置在服务器上,这样比较方便管理,但随着网络技术的迅猛发展,数据分布存储和分布处理越来越重要,从分布于不同地理位置的数据库系统中获取相关信息已成为必然趋势。为了满足这些需求,人们在成熟的集中式数据库技术的基础上提出了分布式数据库。可以说,分布式数据库是数据库技术和网络技术两者相互渗透和有机结合的产物。  集中式数据库系统尽量减少数据的冗余,但是分布式数据库系统却需要增加数据的冗余来保证系统的可靠性,提高系统性能和效率。所以分布式数据库系统和集中式数据库系统的实现机制是不同的,分布式数据库系统需要适当地增加数据的冗余,这使得查询处理更加复杂。那么,在分布式数据库查询处理过程中,对查询过程进行优化能够降低查询代价,提高查询效率,特别是在传输数据量很大时,选择一个好的优化算法就显得尤为重要。  本文首先介绍了分布式数据库系统的基本概念,如分布式数据库系统的起源与发展,分布式数据库系统的定义及特点,数据分片和数据分布的具体概念及原则分类,分布式数据库系统的模式结构及体系结构等等。  其次简要地描述了分布式查询处理过程和常用的分布式数据库查询优化算法,如基于关系代数等价变换规则的优化算法、基于直接连接操作的优化算法、基于半连接操作的优化算法和SDD_1算法。  最后本文在研究上述分布式数据库查询优化算法的基础上,针对SDD_1算法的不足之处(选择因子很难估算、需要进行多次辅助运算等等),提出了一种新的查询优化算法,本文暂且命名为基于二次半连接的分布式数据库多元连接查询优化算法。这种算法避免了SDD_1算法的不足,采用了二次半连接技术,对两个站点之间的联接进行了完全缩减,再结合最小生成树算法的思想,可以得到多元连接查询优化的最小通信代价,以及在获得该代价时的各站点的装配情况和连接先后顺序。根据算法实例结果的分析,该算法能够取得与SDD_1算法相似的查询效率,而且运算量不大,在某些特定的情况下,完全可以代替SDD_1算法,取得很好的查询优化效果。  
其他文献
光网络中通信量的疏导是光网络研究领域的一个重要的前沿和热点问题,也是一个科技含量和商业价值并重的研究课题。通信量的高效疏导能有效的降低网络的建造成本和费用,因而一
门限签名是这样一种签名体制,它主要应用于需要将签名权力以门限的方式分散在群组的各成员间的场合中。在一个(t , n )门限签名中,群组的签名密钥被n个成员以门限方式共享,其
现有的C/S结构电子商务系统存在着静态性的缺陷。在电子商务领域引入移动Agent技术可以解决这个问题。 本课题的目标是设计一个基于移动Agent的B2C智能导购系统。系统的已
随着Internet的快速发展与日益普及,互联网的安全问题是目前被广泛关注的热点问题,其中电子邮件的安全是一个极为重要的方面。传统的电子邮件都是基于MIME协议并通过明文传送
SAGE:简单自适应性的网格引擎(Simple Adaptive Grid Engine),是我们实现的一个基于纯C++的分布式网格中间件,其主要是用于构建在桌面应用和集群计算服务之间的分布式通讯应
随着机器人的发展和技术的不断提高,机器人已经被应用到生产,生活,军事等各个方面,机器人能代替人工完成一些高难度的,恶劣环境下的工作。受到鸟类可随意栖息的启发,我们团队
入侵检测系统是在目前网络安全问题日益突出的环境下,提出的一种对网络传输进行实时监控,主动保护自己免受攻击的一种网络安全技术。尽管这项技术经历了长足的发展,但是在某
变分优化是指对于给定的问题,首先将问题建立优化模型函数,然后求解函数的极值的过程。变分优化方法是一门应用非常广泛的学科,它已经被广泛的应用到经济计划、工程设计、生
电力负荷预测是电力系统的一项基本工作,是安全调度和经济运行的重要依据,在电力市场下,各电力公司要制定合理的经济模型和具有竞争力的实时电价,必须依赖于准确和快速的负荷
随着多媒体、网络技术的飞速发展,工程图纸数字信息在企业生产部门中的应用日益广泛,如何从大量的工程图纸信息中快速而准确地检索出所需的信息成为一个亟待解决的问题。本文