查询交互量化与查询响应时间预测模型

来源 :太原理工大学 | 被引量 : 3次 | 上传用户:xiaowei_0315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询响应时间预测模型是数据库系统管理的核心技术,广泛用于查询调度、资源分配、系统容量规划、性能调优等任务。并发执行的查询(查询组合)会发生查询交互,表现为查询之间对资源的竞争或合作,是影响查询响应时间变化的主要因素,在建立预测模型时必须予以考虑。当前的查询响应时间预测模型分为分析型和统计型两种。分析型建模通过描述查询执行过程来预测响应时间,需要对查询执行过程,特别是查询之间的资源竞争,进行抽象——保留主要特性,丢弃大量次要细节。查询交互是一个复杂的过程,这类模型在描述查询交互时,或者过于抽象导致精度差,或者过于繁琐导致系统误差大、可用性差。统计型建模利用执行过的查询(样本)的性能参数,通过机器学习方法,对查询响应时间建模,能够在模型复杂度与可用性之间取得平衡。但由于需要离线采样,存在采样成本高、模型动态性差的问题;对查询交互的描述只是概念性的,未进行系统性的量化分析。本文以查询响应时间预测的统计模型为研究对象,试图通过对查询组合中查询交互的量化分析,选取合适的查询组合样本,降低建模的采样成本,并寻找基于查询交互量化、可在线更新的统计模型,用于数据库系统的性能管理。针对统计模型采样成本高的问题,本文通过对查询组合聚类,分类选取高质量的样本。相比传统的随机采样方法,聚类采样依照样本属性,从各类中按照样本的代表性选取样本,选取的样本质量高,使用较少的样本就可以训练统计模型,并达到合理的预测性能,从而降低统计建模成本。为了能够对查询组合空间进行聚类,本文提出一种两个查询间查询交互的度量方法——QueryRating,并依据QueryRating构造一个查询与其它查询之间的查询交互特征向量。以此为基础,将查询组合映射到体现查询交互分布的二维特征平面中,形成查询组合的查询交互特征向量,并利用该特征向量对查询组合进行聚类。针对现有统计模型不能对查询交互进行系统的量化分析的问题,本文以查询交互存在的形式——查询组合为对象,度量其中的查询交互,比较查询组合之间的相似性,从而提出预测查询响应时间的相似性模型。相似性模型从查询交互量化的角度建模,利用查询组合的查询交互特征之间的相似度,寻找与被预测查询所在查询组合相似的查询组合进行预测,简化现有统计模型的线性拟合步骤,使得查询交互成为模型考虑的主要因素,进而提高预测精度。针对统计模型动态性差的问题,本文在相似性模型的基础上,提出模型在线更新算法。该算法利用数据库系统运行过的查询组合的运行参数,对样本库进行更新。相比传统的线性模型,相似性模型的预测性能不受初始样本限制,模型的动态性更强。作为对相似性模型的应用和验证,本文在相似性模型的基础上构造了一个在线查询调度器——最小查询交互调度器,最小查询交互调度器通过求解最小化查询交互的线性规划问题,寻找期望查询组合集合。在线调度时,每当有一个查询执行完成,最小查询交互调度器从查询队列中选取一个待执行查询,与数据库系统当前正在运行的其它查询组成一个期望查询组合,保证数据库系统运行的查询组合总是期望查询组合集合中的元素,通过在线调度的方式,缩短队列的运行时间。与现有的调度器相比,最小查询交互调度器拥有更细的调度颗粒度,不仅可以从队列整体的角度考虑调度问题,还可以在线寻找最合适的查询,缩短队列运行时间,提高数据库系统的效率。本文的主要贡献和创新点如下:(1)提出查询交互的量化方法。查询交互是查询响应时间变化的主要因素,目前尚没有对查询交互进行量化的方法。两个查询之间的查询交互是最简单的查询交互形式。本文提出QueryRating量化方法——查询单独运行与查询两两运行时的响应时间比值,它是对最简单的查询交互形式的一种度量。在此基础上,本文系统性地构造了查询的交互特征向量以及查询组合的交互特征向量,为后续的研究提供基础。(2)提出一种聚类采样的方法。该方法利用查询组合的交互特征向量,依据欧氏距离对查询组合空间进行聚类,分类选取有代表性的样本训练统计模型。在保证模型精度的前提下,可以大幅减少样本数量,降低统计模型建模的采样成本。(3)提出一种利用查询组合相似性、预测查询响应时间的模型——相似性模型。该模型通过量化查询组合中查询交互的方式,计算查询组合之间的相似性,通过寻找与被预测查询所在查询组合最相似的查询组合的方式,对查询的响应时间进行预测。该模型相比传统的线性模型具有更好的预测性能。(4)提出相似性模型在线更新的方法,提高模型的动态特性。该方法利用查询执行后的运行参数,对样本库进行更新,使得相似性模型能够不受初始样本限制,在数据库系统运行同时保证预测性能。(5)构造了一个最小化查询组合中查询交互的查询调度器——最小查询交互调度器。最小查询交互调度器通过求解最小化查询交互的线性规划问题,有效地缩小了在线调度时的搜索空间,使调度器可以选择恰当的查询进入系统,缩短一批查询的运行时间,提高数据库系统的运行效率。
其他文献
习题讲评课是高中学科教学的重要组成部分,它的实施有利于学生巩固所学知识,提高解决问题的能力,从而不断提升其学科核心素养。习题讲评课也是教师分析评估学生的学习情况的一个重要参考,有助于教师在教学过程中不断调整教学策略,提高课堂教学效果。习题讲评课可以按照教师选题选生、讲题学生准备、听题学生准备、教师适时调控的顺序实施。
多组元高熵合金因其成分和组织的多样性赋予了其众多优异的性能,如高强度、高硬度、高抗氧化性等。对于单相面心立方高熵合金而言,尽管其具有优异的室温拉伸塑性,但强度较低。为了优化面心立方高熵合金的性能,需要适当引入固溶原子、位错、孪晶、晶界和第二相等结构缺陷,并调控其微结构使高熵合金的力学性能得以提高。本文通过热机械处理对AlxCoCrFeNi(x=0.1~0.8)高熵合金显微组织结构进行调控,并对相应
在我国中西部的黄土高原地区,气候干旱,第四系松散含水层中地下水既是居民生活与生产的重要供水水源,又是生态环境需水的重要保障。在薄基岩矿区,地下矿井的开采破坏了上覆松散含水层,造成含水层地下水位下降,水资源供需矛盾加剧,生态环境恶化。而在采深较大的晋东南厚黄土区,煤层开采对松散含水层未造成直接影响,越流引起的松散含水层中地下水持续下渗、漏失常常被忽视。因此,综合研究厚黄土区松散含水层地下水对煤矿开采
镁合金作为实际应用中最轻的金属结构材料,在航空航天、汽车、交通、电子及生物医用领域具有广阔的前景。然而与钢铁以及铝合金材料相比,绝对强度的不足和较差的成型能力限制了其工业应用。常规的塑性变形能够改善其性能,但是仍然存在着基面织构强度高、强度和塑性匹配失衡性等问题,本文从细晶强化出发,通过不同的大塑性变形方式结合脉冲电流处理技术细化和调控镁合金的组织结构,从而改善其综合力学性能。通过金相分析、电子显
燃料电池汽车通常是指动力系统由燃料电池与动力电池组成的“电-电”混合动力汽车,其中燃料电池为主要动力源,动力电池为辅助动力源。动力系统能量利用率的高低,直接影响了动力系统能耗量的大小,即整车等效氢耗量的大小和行驶里程的长短。提高动力系统能量利用率对燃料电池汽车的应用、推广和发展具有重要的意义。提高燃料汽车电池动力系统能量利用率,主要从减少系统能量消耗和能量回收利用两个方面进行研究。优化动力系统能量
深海地貌印象深海和陆地一样,有高山、丘陵、盆地和平原。如果能将海水舀干,首先映入眼帘的就是一条首尾相连的"巨龙"。这条被称为"洋中脊"的巨型海岭的面积约占世界大洋总面积的33%。深海平原位于洋中脊与大陆边缘之间,而在大陆边缘却常伴有深邃的海沟。
期刊
微型零件或具有微细结构零件的需求日益增长,促进了微细制造领域的发展,微细轴作为微细制造领域的重要产品、工具,其制造精度直接影响作为产品的操作性,尤其是作为工具再应用于微细制造,如微孔、微槽、微细表面三维结构的加工,被加工零件的制造精度取决于微细轴的加工精度,即其直径一致性,包括单一微细轴轴向一致性及批量加工微细轴的重复一致性。目前微细轴的制造技术以微细电火花加工(Micro electrical
动力学是力学的分支学科,研究作用于物体的力与物体运动的关系.在微观世界中原子和亚原子粒子的动力学研究属于量子力学的研究范畴.量子力学的发现引发一系列划时代的科学发现与技术发明,应用于原子物理学、固体物理学、信息学,对人类社会的进步做出重要贡献.量子关联是当前量子力学研究的热点问题之一.由于它有重大的应用价值和科学意义,已引起越来越多的物理学家、计算机学家、数学家、力学家等领域专家学者的高度关注.本
分析经腹超声检查对妊娠期宫颈机能不全患者的诊断效果,为相关人员的研究工作提供科学参考。选择56例妊娠期子宫颈机能不全患者为研究对象,对其开展经腹部超声检查,分析诊断结果。在所有子宫颈机能不全患者中,子宫颈长度在2.0 cm以下者所占比例最高。子宫颈管宽径在0.8 cm以上者共计34例,占患者总数的60.7%;羊膜囊/内部包含胎体脱入膨大宫颈管患者18例,占患者总数的32.1%。38例不存在显著羊膜
非线性动力学是研究非线性系统中各种运动状态的定量和定性规律特别是运动模式演化行为的一门交叉性学科。混沌、分形和孤立子是非线性动力学研究对象的三个主要组成部分。孤立波现象的研究起源于流体力学,在流体力学领域的实验和理论上均证实了孤立波的存在。上世纪中期开始,固体物质中孤立波现象的研究逐渐发展起来,科学家们推导出了固体物质中一批非线性演化方程的孤立波解,并阐述了其在固体力学中的具体应用。本世纪初期以来