openGauss索引推荐方法的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhanglq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,各种应用的业务逻辑变得更加复杂,涉及到的数据急剧增加,对数据库性能的要求也越来越高。在当前国际形势下,为避免核心技术受制于人,数据库系统软件国产化已是必然趋势,Gauss DB采用大规模并行处理架构,同时支持行存储与列存储,并提供PB级别数据量的处理能力。openGauss作为Gauss DB的开源版本于2020年7月发布,集成了机器学习结合数据库调优的技术,其中智能索引推荐技术可以根据工作负载推荐合适的索引集合用于提升工作负载执行效率,但该功能只支持SELECT查询的索引推荐,并在对索引收益进行估计时没有考虑整体工作负载。为了增强openGauss的功能特性,需要扩大索引推荐支持语句的范围,并将整体工作负载及索引维护代价加入索引收益估计中。针对openGauss 2.1.0版本,本文研究并实现了一种基于机器学习的索引推荐方法。首先,自动收集SELECT、DELETE、UPDATE及INSERT四类语句,在筛选工作负载的同时获取相应的特征信息;其次,对收集到的工作负载进行词法、语法分析,在索引三星评价标准的基础上设计5种索引生成方法来生成候选索引集合;然后,通过随机森林预测索引建立后查询所需的代价,并计算索引为工作负载提供的优化效果;最后,根据计算的优化效果以及工作负载的统计信息推荐出能为工作负载带来最大性能提升的索引集合。将实现的索引推荐功能与openGauss2.1.0自带的索引推荐功能进行对比,实验结果表明,在限制最大索引数量的条件下,相同工作负载使用本文方法推荐的索引集合与openGauss相比减少了约24%的执行时间。在限制最大索引空间大小的条件下,相同工作负载使用本文方法推荐的索引集合与openGauss相比减少了约15%的执行时间。
其他文献
移动众感是一种结合众包思想和移动智能设备感知能力的数据获取方式。与传统的传感器网络不同的是,移动众感具有部署灵活经济、感知数据多源异构、覆盖范围广泛均匀和高扩展多功能等优点,因此受到广泛关注。然而,移动众感机制中存在隐私数据泄露的问题,这导致感知服务请求者和工人参与移动众感系统的意愿均不足。现有研究多探讨鼓励参与者参与移动众感系统的激励机制或工人的位置隐私,忽略了感知任务的位置隐私也可能会暴露感知
学位
目的 探讨膝关节周围骨折内固定术后早期中西医结合康复治疗的效果,为临床提供参考。方法 选取2021年1月至12月佛山市中医院收治的106例膝关节周围骨折内固定术后患者为研究对象,按照随机数字表法分为对照组和观察组,每组53例。对照组患者采用术后常规治疗,观察组患者采用术后早期中西医结合康复治疗,治疗3个月后,比较两组患者的康复效果、并发症发生率、膝关节恢复指标、中医证候积分及生活质量。结果 观察组
期刊
在日常生活中,人们通常会接触到各类有关民生服务的信息,如:政策法规信息、衣食住行信息、社会保障信息和防灾救灾信息等等。然而,由于民生服务信息具有多样性、复杂性、数据量大的特点,使得人们不可避免的受到信息过载的影响,从而无法快速地获取到自己所需要的民生服务信息。因此,在某公司的支持下,本文设计并实现了一个民生服务信息推送系统,从而帮助人们从种类繁多、数量庞大的民生服务信息中筛选出对自己有价值的服务信
学位
随着我国水利信息技术的发展,水利领域中出现了越来越多的优秀系统,这些系统在近些年来积累了海量的水利领域相关数据,这些数据大多都储存在各自的系统之中,没有被充分的利用起来。知识图谱技术具有强大的语义处理和互联组织能力,可以有效的将这些积累的数据组织起来,充分挖掘数据价值,实现水利信息资源的高效利用。知识图谱可以认为是由本体与数据组成,对本体进行数据的填充即构成了知识图谱。本体的构建可以认为是知识图谱
学位
随着社会数字化的推进,传统金融行业与互联网技术的融合不断加深,新兴互联网金融为金融行业发展注入新的活力。命名实体识别技术可以从海量的金融信息中挖掘出有效的信息,在促进智慧金融发展、提升金融服务质量、满足多元化投融资需求等方面发挥积极作用。然而,现阶段的命名实体识别模型针对中文互联网金融领域的研究较为匮乏,不能有效识别出金融实体,进而影响金融行业获取信息的效率。本文结合中文互联网金融领域文本语言结构
学位
OpenCL凭借其开放性和代码可移植性成为异构并行计算中热门的并行编程框架。OpenCL程序不具备良好的性能可移植性,当OpenCL程序跨平台移植时需要重新对其进行参数优化,该过程耗时耗力,故OpenCL程序的参数自动优化一直是研究重点。在OpenCL程序参数自动优化中,存在调优参数选择不合适而无法有效发挥设备性能的情况。在搜索空间的选择上通常会选择较大的搜索空间以保证对多种设备的兼容性,该方式会
学位
近年来,数字出版已经形成了较为完整的产业链,供给方通过将物品的使用权让渡给使用方,并以此获取一定回报。然而,由于这些多媒体数据多是由数字图像、视频、音频和文本组成的,在网络传播的过程中极易泄漏和篡改。作为保护作品版权的主要方式,数字鲁棒水印技术在保护数字版权领域中有着举足轻重的地位。现行水印方案的时间性能受限于运行设备的计算能力,运行空间以及图片规模等因素难以发挥出全部的性能,限制了水印技术的广泛
学位
随着中国数字产业的持续发展,网络化软件已然成为当下软件工业化的主流应用。而当下庞大的软件规模和软件单元之间的复杂异构关系使得软件在运行期间所涉及到的资源可能会随时发生变化,一旦软件在运行过程中出现无法承受巨大的压力出现宕机情况,企业乃至于社会层面付出的代价将是无法估量的。因此如何让网络化软件在运行过程中自行分析软件状态或环境状态变化,实现软件在线自优化,成为目前软件工程领域的巨大挑战和热门研究课题
学位
随着互联网和人工智能技术的快速普及与发展,数据信息的收集与共享日渐频繁,各大机构根据已发布的数据通过数据挖掘技术发现用户的潜在行为和需求,推动精准服务领域的发展,而由此带来的数据安全问题也愈发严重。一方面,公开的数据中包含敏感信息,考虑到敏感信息内隐含了用户的身份信息,财产流水等隐私,因此数据发布者须对真实数据进行隐私保护后再发布。另一方面,数据发布的目的是使用数据并产生相关的价值,隐私保护后的发
学位
在自动驾驶领域,对路面上小障碍物检测,能够帮助汽车躲避障碍保证驾驶安全。随着具有辅助驾驶功能的新能源汽车的推广和普及,小障碍物的检测定位越来越具有意义。然而小目标在图像中占有的像素少、边缘信息模糊,使得关于小目标检测的研究充满挑战。本文创建了路面小目标障碍联合数据集,数据集中驾驶场景丰富、目标种类多样、小目标占比超过90%。目标检测算法在小目标联合数据集上的性能作为衡量算法对小目标检测性能的标准。
学位