基于机器学习的执行计划缓存优化研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:leoki111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,人工智能技术作为一种重要的数据处理与分析的工具,已被应用在生活中各种领域。而数据库作为人工智能的数据载体,需要为其提供更快、更便捷的查询服务。然而,随着数据量的不断增大,传统数据库优化方式面临新的瓶颈。因此,寻找一种更为有效的数据库优化方法成为了目前亟待解决的问题。如今,人工智能在数据库优化任务中已有大量的研究,例如,基数估计、连接顺序选择和执行计划缓存等。其中执行计划缓存绕过优化器,直接将历史查询的执行计划保存在缓存中,然后从缓存中为查询分配执行计划。虽然该方法可以节省查询时间,但目前缺乏高效的方法从缓存中分配执行计划。目前,已经有很多研究尝试提高执行计划缓存的准确率,但是它们大多存在以下三个问题。首先,它们缺乏高效的特征向量提取方式。绑定变量的特征提取是执行计划分类的关键,如果无法将绑定变量具有分类性质的特征提取出来,那必然会影响模型的准确率。其次,它们难以动态的维护执行计划缓存。当数据库中数据发生变动,已保存的执行计划可能不适用于新的参数空间,因此需要动态调整执行计划缓存模型,保证模型预测准确率。最后,现有模型在实际应用场景中的训练效率低下。由于数据库系统都是线上进行查询,无法像离线任务一样有充足的数据和训练时间,因此要保证模型在短时间内完成训练,并且使用少量的训练样本就可以达到较高的准确率。针对以上方法中存在的问题,本文的主要工作是提出一种基于机器学习的执行计划缓存的方法COPC。具体地,COPC针对参数查询优化任务提出了一种新型的数据编码方式,相比于传统数据编码方法的缺陷,COPC不但可以获得参数在表中的量级信息,还可以获得参数的空间信息,解决了参数特征提取能力不足的问题,其中量级和空间信息可以精确的捕捉不同参数的分类特征。然后,为了动态维护执行计划缓存,本文基于该编码方式提出一种自适应随机森林算法并将其应用在执行计划缓存的分类任务中,这使得COPC仅仅使用少量的数据和训练时间就可以达到较高的准确率,并且模型支持增量训练。然后将本文提出的模型与基线模型在公开数据集中进行测试,实验结果从效率和准确性上证明了模型COPC的有效性。此外,本文还对常见的机器学习分类算法进行了对比试验,其结果体现了自适应随机森林算法在执行计划缓存任务中的先进性。
其他文献
在我国经济平稳运行的背景下,农村社会的发展取得了显著的成效,农村居民文化需求得到进一步释放,村民对于公共文化服务的要求也逐渐提高。推动农村公共文化服务发展,促进农村公共文化服务的提质增效成为了推动农村文化振兴的重要环节。国家以更加积极有为的公共文化政策为引领,不断加大农村公共文化财政支出,并对公共文化服务水平进行调控,但是农村公共文化服务的供给和需求之间仍然存在着差距,出现了供需不均导致的满意度不
学位
南宋后期行船诗研究是通过选取时间跨度在南宋开禧北伐失败(1207)至南宋灭亡(1279)之间、记叙诗人的行船经历及所见所闻所感的诗作展开的分析研究。本文通过对南宋后期行船诗的归纳与整理,立足于南宋后期的时代背景,从多个方面对行船诗进行分析,力求完整详尽地剖析行船诗的内容与艺术特色,从而探求特定时期下诗人创作时的思想情感与文化内涵。本文的主要章节如下:绪论部分交代选题的缘起与意义,对南宋后期行船诗进
学位
中国古代文学批评中有“以水喻文”的现象,文学批评家从水意象出发,以水的独特属性和存在状态为依据,表达对文学的看法和理解,其内容在北宋文学批评中表现极为丰富并颇具理论特色。北宋文学批评中的“以水喻文”是北宋士大夫政治影响下士人的精神、境遇和心境在文学批评中的反映,也是先秦“以水喻道”“以水喻人”等“水喻”思想的延续。北宋文学批评中“以水喻文”的批评主体多为诗文革新的倡导者和追随者,其表现形式可以概括
学位
中国共产党从成立伊始,就高度重视对少数民族问题的研究。正确处理和少数民族的关系历来是中国共产党统一战线的重要组成部分,在党的历史上占有重要地位。随着实践的发展,中国共产党在调查研究各少数民族发展情况、领导其进行民族民主革命的过程中,不断深化对少数民族的认识。抗日战争胜利后,内蒙古地区对于抢占东北、力争华北极具重要性,同时,国共两党对少数民族的政策与态度也在一定程度上反映了当时的中国面临两种命运与前
学位
[目的 /意义]基于智慧文旅的图书馆阅读推广模式创新将促进图书馆智慧转型和创新发展,促进图书馆阅读推广事业的发展。[方法 /过程]通过文献梳理,分析文旅融合阅读推广的研究现状和问题,尝试构建基于主体、客体、推广资源、推广媒介的图书馆新型阅读推广模式——基于智慧文旅的图书馆阅读推广模式(SCTLRP)。[结果 /结论 ]基于智慧文旅的图书馆阅读推广模式首先需要搭建基于智慧文旅的数据收集、处理、传输与
期刊
随着文旅融合的不断深入和信息技术的迭代升级,智慧文旅服务持续推陈出新、创新发展。以省份为单位,选取了具有代表性的40个智慧文旅平台进行调研,对基于智慧文旅平台的数字化创新服务进行了全方位的研究;采取网络调查法、案例分析法等多种方法,着重从服务渠道、服务技术、服务内容、服务功能4个方面进行了解构分析,并针对当前智慧文旅平台存在的不足,提出了政企民商多主体参与建设、整合构建统一平台与标准、实现用户个性
期刊
动词一直以来都是对外汉语教学的重点,汉语学习者对动词的掌握程度直接决定着沟通的连贯与准确。本文以"产生"类动词为例,基于论元结构构理论,借助本族语语料库和中介语语料库,探索对外汉语学习词典的动词释义模式。本文首先基于论元结构构式理论,以“事物从无到有的过程”为核心语义,在HSK中找到符合该情景的五个动词,然后基于本族语语料库,借助语料库提取工具,对其论元结构下关联的参与者角色进行总结与分析,得出其
学位
经济发展全球化的背景下,企业扩张迅速,商业模式也日新月异,业务拓展变化更快,这使传统的财务管理模式难以匹配此种变化。为此,财务共享模式开始引起学界和实务界的关注,以求简化核算流程,提升管理效率,降低成本增加效益。这种共享模式尤其适合大中型企业集团,使用财务共享更有利于提升财务工作效率,更有利于实现业财流程化,还可以增强企业财务管理水平。诚然,实践中有些财务共享中心在发展中也出现了诸多不足,诸如母子
学位
深度学习算法被广泛地应用于网络流量分类,具有较好的分类效果,应用深度学习方法不仅能大幅提高网络流量分类的准确性,还能简化其分类过程。然而,基于深度学习的网络流量分类方法面临着中毒攻击、对抗攻击等安全威胁。因此,为了验证使用深度学习算法进行网络流量分类具有不安全性,本文对基于深度学习的网络流量分类方法进行了对抗攻击和中毒攻击的攻防研究,在保证网络流量分类场景的可行性下,探究了中毒攻击和对抗攻击两种攻
学位
明代花鸟画在风格上远习唐宋,近承元人余绪,名家辈出且遗存画作较为丰富,其中以麻雀题材的作品数量可观,且具有一定代表性。画史记载,麻雀题材绘画作品自南北朝时期就已经出现,经过历代的发展,到明代麻雀题材作品在立意、形式、技法上均较之前有所发展。本文以花鸟画中麻雀题材为研究对象,以明代花鸟画中的麻雀形象为样本进行研究,通过绘画作品中麻雀题材的文化追溯和个案分析研究,分析明代麻雀题材发展的内外因素,并结合
学位