基于改进遗传算法的分布式数据库查询优化

来源 :广西大学 | 被引量 : 0次 | 上传用户:tgw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,信息技术高速发展,海量的文字、图片、音频、视频等数据随之产生,大数据的研究亦随之引起广大学者重视,其中分布式数据库的研究就是热点之一。在分布式数据库中查询是最频繁的操作之一,提升它的效率显得非常有必要。数据量不断增长这个事实,使得对分布式数据库查询的要求也越来越高,因此设计一个高效的分布式查询方案变得刻不容缓。  论文首先介绍了分布式数据库的基本概念和常用的查询优化技术、遗传算法的特点和执行流程,针对FCM(Fuzzy C-means)算法的不足提出了优化方案,利用优化的FCM算法结合遗传算法实现本文的改进遗传算法,在分布式数据库查询使用本文的改进遗传算法进行优化。  本篇论文的主要研究工作可概括为如下:  (1)FCM算法是一种基于目标函数的模糊聚类算法,主要用于数据的聚类分析,但FCM算法的效果经常受到初始聚类中心的影响,而且收敛结果易陷入局部最优。针对这些问题本文提出了一种FCM算法的优化方案,设计了选取初始聚类中心规则,采用此规则能够获得聚类结果的全局最优解。模拟实验表明,优化的FCM算法相较传统的FCM算法,准确率更高,迭代次数也更少。  (2)针对传统遗传查询算法的缺陷,本文采用设置多种概率的方法,将通过FCM聚类优化算法处理的当代全部个体分成三类,每一类设置成不同的概率,其中级别较低的个体设置较高的交叉和变异概率,增加产生新个体结构的能力,级别较高的个体设置较低的交叉和变异概率,降低优良基因被破坏的可能性,而对中间级别的个体则设置介于较高和较低之间的变异概率,较好解决了交叉和变异概率设置过大或者过小的情况,有效地防止算法陷入局部最优。实验结果表明,改进后的遗传算法能在较短时间内找到最优的查询执行计划,提高查询效率。
其他文献
历史太阳观测数据是进行长周期太阳活动研究不可多得的资料,完善和丰富历史观测资料的相关信息是开展相关研究工作的先决条件。本文以美国国立太阳天文台(NSO)历史H?观测资料扫
随着互联网的发展,网络上视频的数量呈爆炸式增长。分析发现在主流的视频分享网站中存在巨大数量的内容冗余的视频。用户在搜索视频时会返回大量的重复结果,从而导致了用户体
近年来,社会网络对人的影响因网络技术和通信技术的飞速发展而加深。与之对应,一类新的具有社会化特征的恶意Agent也因新的技术而层出不穷。譬如,网络空间的分布式拒绝服务式攻
随着当今社会科技的飞速发展,无线传感器网络已经融入到人类日常生活和社会活动的各个领域。定位技术对无线传感器网络有着至关重要的作用,有了节点的位置信息后,可以开发出许多
最近几十年来,随着虚拟现实、影视动画和计算机游戏等领域的不断发展,柔性物体的计算机仿真逐渐成为计算机图形学领域研究的热点之一。如何健壮、快速和准确地模拟物体之间的
随着物联网技术的兴起,物与物之间的交互变得十分重要,要求设备也要像人类那样具备情境感知的能力。情境感知计算简单说就是通过传感器及其相关技术使计算机或设备能够“感知
随着网络和信息技术的发展,很多的企业和部门已经积累了大量、使用不同数据库管理系统、以不同形式存储的数据。当前,在解决异构数据集成的问题上主要有联邦数据库、数据仓库、
互联网的普及和高速发展,使得网络上的电子文档迅速增加,但是给用户带来大量信息的同时,使得用户查找、过滤和管理这些海量信息非常困难。因此,文本分类技术的研究引起了人们的持
针对传统 C4.5 决策树算法在处理含有大量噪声和多值属性的大型复杂数据库中的多维度数据集分类问题时决策树分类响应时间长、准确度低的问题,提出了一种新的剪枝算法—CDC算
公司或组织为了在遗留系统的基础之上,进行业务需求变更带来的持续迭代和改进,或者实现向新系统的迁移,并降低这一过程可能引起的不可预期的副作用,比如业务丢失等,需要仔细