分布式数据库中间件Mycat的查询优化研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:jackwang02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据的发展,产生了海量的数据,而单一节点数据库存在着存储和处理瓶颈,因此分布式数据库中间件成为应对海量数据存储和处理的一种解决方案。本文在前人研究基础上,对分布式数据库中间件Mycat的查询优化进行了研究。针对Mycat中分片字段查询效率高于非分片字段查询的现象,提出了一种基于冷热数据字段的分片字段选择策略,使查询操作大概率命中于分片字段查询,从而提高了系统性能;在两表跨库等值连接查询中,针对数据广播阶段由于数据量大而影响查询效率的问题,提出基于改进BloomFilter的两表跨库等值连接查询的优化策略,对连接广播数据进行过滤,减少了广播量,提高了两表跨库查询效率;在多表跨库非等值连接查询中,两两连接执行顺序直接影响着多表查询效率,针对此问题,提出了基于蚁群算法的多表跨库非等值连接查询优化策略,得出了两两连接的最优执行路径,提高了多表跨库查询效率。本文完成的工作如下:1)针对分片字段选择策略,对指数平滑法的平滑系数进行了研究,给出了一种快速率计算方式,对前人的代价估计模型进行了优化,使其更符合选择策略。并应用于智能硬件物联网实际项目测试数据集中,进行了实验分析,选出了最优的分片字段。2)针对两表连接优化,对BloomFilter算法进行了改进,提出了一种扩充型BloomFilter,该扩充型BloomFilter相比传统BloomFilter和K分组合型BloomFilter具有更低的误判率,且扩展性更高。并通过实验分析,与索引查询优化相比,BloomFilter算法具有易维护和可迁移的优势。3)针对多表连接优化,将蚁群算法应用其中,提出了一种不均的初始信息素分布策略,并将连接传输代价和连接时间代价综合考虑,进行多目标优化。通过实验验证了在多表连接的优化中,蚁群算法得出的路径是最优解或最优解的近似解。4)将优化后的Mycat应用到实际的智能硬件物联网项目中,并进行查询测试,验证了优化后Mycat在实际项目中可以提高查询效率本文提出的查询优化策略,经实验验证,能够提高各种复杂查询语句的查询效率,并且能够提升Mycat应对海量数据的处理能力。
其他文献
沙蜇(Stomopholus meleagris)是一种大型可食性水母,广泛分布于我国的黄、渤海至东海。在我国,沙蜇已有一千多年的利用历史,传统医学典籍和现代科学研究都已证明沙蜇具有良好的
目的观察健脾解毒汤辅助治疗复发性口腔溃疡的临床价值。方法随机将我院2017年3月~2018年3月收治的80例复发性口腔溃疡患者分为两组,每组40例。对照组给予康复新液治疗,观察
目的进一步提高辅酶Q10发酵生产水平。方法对类球红细菌RQ17-296进行ARTP(常压室温等离子体)等离子与对氨基苯甲酸和叠氮化钠复合处理。结果和结论经大量筛选,得到了辅酶Q10
近日,中国银保监会发布《商业银行理财子公司净资本管理办法(试行)》(简称《办法》),这是对此前资管新规和理财新规的具体落实,进一步完善了理财业务监管体系,规范了商业银行理财子公
报纸
自今年6月份首批银行理财子公司开业后,目前包括6家国有大行、3家股份制银行共9家银行理财子公司陆续开业,年底银行理财子公司获批正在“加速”。$$12月19日,兴银理财宣布在福州
报纸
大型公共建筑内火灾的频繁发生正在引起社会的高度关注,为解决火灾情况下人员的疏散问题,尽可能减少人员伤亡和财产损失,本文基于建筑行业新兴的BIM(Building Information Mo
分析化学是大学化学系的一门基础课,它涉及无机、有机、物化、环化、生化以及物理的理论和实验方法,具有其他学科不可替代的作用.分析化学是研究测定物质组成的分析方法及其
《玫瑰之名》是意大利知名学者翁贝托·艾柯声名鹊起之作,也是一部集历史、神学、哲理于一体的经典的反侦探小说。艾柯在这部小说里套用侦探小说的外壳,极尽反讽之能事,巧妙
本文采用动电位扫描方法研究了硫酸盐水溶液中的金属Ni阳极过程。金属Ni阳极溶解与钝化表现为电荷传递分步进行、并以失去第一个电子的电化学反应为控制步骤的不可逆电极过程
水系工程是城市景观建设中最具魅力的卖点。开封作为我国传统古都城市,其蕴涵的文化资源是任何新兴旅游城市都无法比拟的。开封市水系工程"一渠六河"工程兼具实用性、艺术性,