【摘 要】
:
由深度学习驱动的学习型查询优化器正在越来越广泛地受到研究者的关注,这些优化器往往能够取得近似甚至超过传统商业优化器的性能.与传统优化器不同的是,一个成功的学习型优化器往往依赖于足够多的高质量的负载查询作为训练数据.低质量的训练查询会导致学习型优化器在未来的查询上失效.提出了基于强化学习的鲁棒的学习型查询优化器训练框架AlphaQO,提前找到学习型优化器做不好的查询,以提高学习型优化器的鲁棒性.AlphaQO中存在两个重要部分:查询生成器和学习型优化器.查询生成器的目标是生成“难”的查询(传统优化器做得好,
【机 构】
:
清华大学计算机科学与技术系,北京100084;浙江大学计算机科学与技术学院,浙江杭州310027;Qatar Computing Research Institute,Hamad Bin Khalif
论文部分内容阅读
由深度学习驱动的学习型查询优化器正在越来越广泛地受到研究者的关注,这些优化器往往能够取得近似甚至超过传统商业优化器的性能.与传统优化器不同的是,一个成功的学习型优化器往往依赖于足够多的高质量的负载查询作为训练数据.低质量的训练查询会导致学习型优化器在未来的查询上失效.提出了基于强化学习的鲁棒的学习型查询优化器训练框架AlphaQO,提前找到学习型优化器做不好的查询,以提高学习型优化器的鲁棒性.AlphaQO中存在两个重要部分:查询生成器和学习型优化器.查询生成器的目标是生成“难”的查询(传统优化器做得好,但是学习型优化器反而做得不好的查询).学习型优化器利用这些生成的查询进行测试和训练,并提供反馈让查询生成器进行更新.系统迭代交替的运行上述两个部分,分别进行训练.目的 在于在提供尽量少的信息和消耗足够小的时间下找到足够多“难”的并且未见的查询给优化器训练,以提高学习型优化器的鲁棒性.实验结果显示:该生成器会提供越来越难的训练查询给学习型优化器;同时,这些查询能够提升学习型优化器的性能.
其他文献
针对在流化床中密相区的气固流动行为与污染物NOx之间关系规律和影响机制的问题,本文借助鼓泡流化床反应器,研究了准东煤和柏木在不同床内温度、流化风速和给料速率条件下燃烧时烟气中NOx的浓度,并利用功率谱密度分析法分析了流化床内气固流态.结果 表明,随着温度的升高,床内流化气体密度降低,使得床内截面气速增加,鼓泡流态化更加剧烈,促进了气固混合与接触,从而使烟气中NOx含量显著增大.适当提高流化风速,有利于床层形成充分的鼓泡流态化,使燃料燃烧更加充分,但流化风速过大,也会导致烟气中NOx排放浓度上升.通过降低给
非易失内存(non-volatile memory,NVM)为数据存储与管理带来新的机遇,但同时也要求已有的索引结构针对NVM的特性进行重新设计.围绕NVM的存取特性,重点研究了树形索引在NVM上的访问、持久化、范围查询等操作的性能优化,并提出了一种上下两层结构的异构索引HART.该索引结合了B+树与Radix树的特点,同时利用了Radix结点搜索快以及B+树范围查询性能好的优点.对整体架构进行了精心设计,改进了Radix树的路径压缩策略,设计了NVM写友好的结点结构,并将Radix树叶结点集中存储和链接
针对移动目标检测方法存在的受背景环境影响而导致检测结果不准确的问题,本文提出一种融合高斯混合模型的背景减除法.算法与频率调谐显著性区域检测(frequency-tuned,FT)算法的移动目标检测方法.该研究以摄像头拍摄到的遥控车行走视频为分析材料,在降采样图像上用MOG2算法检测移动目标,经二值化和滤波去噪后框选移动目标感兴趣区域,采用FT算法检测此感兴趣区域,并利用置信度结合两次检测结果完成移动目标检测.实验结果显示,在置信度分别为α=0.6,β=0.4时,本文检测方法将检测300帧图像时平均交并比由
并发控制算法是数据库系统保证事务执行正确且高效的重要手段,一直是数据库工业界和学术界研究的核心问题之一.将并发控制算法的基本思想归纳为“先定序后检验”,并基于该思想对现有各类并发控制算法进行了重新描述和分类总结.基于在开源内存型分布式事务测试床3TS上的实际对比实验,系统性地探究了各类算法的优缺点和适用场景,为面向内存数据库的并发控制算法的后续研究提供参考.
针对机电液耦合器流固耦合分析对结构设计和后续材料选取的重要性,本文分析了机电液耦合器的结构和工作原理,建立了流固耦合数学模型,形成机电液耦合器的单向流固耦合分析方法.在Workbench中的Design Modeler提取斜盘式柱塞泵的流体域,通过Fluent软件进行瞬态和稳态流场仿真分析,并利用Static Structural对结构进行单向流固耦合仿真分析.仿真结果表明,在额定工况下,求解得到斜盘式柱塞泵最大变形为0.04309 mm,最大等效应力为247.75 MPa,说明流体动力各部件的总变形和等
近年来,数据库系统为了应对新应用和新数据类型对数据管理与分析提出的全新挑战,产生了一系列新的发展趋势,包括:(1)在数据管理方面,计算机硬件的创新与人工智能技术的深入为数据库系统带来了全新的发展机会,而伸缩性、容错性、可扩展性等应用需求又给数据管理带来了全新的挑战;(2)在数据分析方面,数据量的剧增、数据类型的异构与应用需求的多样对数据库系统的分析能力与性能提出了更高的要求;(3)在数据安全方面,多方安全计算、联邦学习等应用和需求的变化给数据库安全与隐私保护技术带来了全新的课题.因此,需要利用和发展现有的
针对夜晚环境中传统交通流量统计出现的实时性、鲁棒性及准确性不高的问题,提出了一种基于改进的YOLO v5s交通流量统计算法.采用残差网络的连接结构对YOLO v5s算法中的Fo-cUs层进行改进.将改进后的YOLO v5s算法与DeepSORT跟踪算法、统计模块搭建高效的交通流量统计框架.采集实际路况的夜间场景视频来对该框架的准确性进行验证.实验结果表明,该算法平均准确率达到92.9%,较改进前提升3.0%,平均检测速度可以达到33.4 Hz,准确率及实时性都能满足交通流量统计要求.该算法框架可有效地提供
新兴分布式计算框架Apache Flink支持在集群上执行大规模的迭代程序,但其默认的静态资源分配机制导致无法进行合理的资源配置来使迭代作业按时完成.针对这一问题,应该依靠用户来主动表达性能约束而不是被动地进行资源保留,故提出了一种基于运行时间预测的动态资源分配策略RABORP (resource allocation based on runtime prediction),来为具有明确运行时限的Flink迭代作业制定动态资源分配计划并实施.其主要思想是:通过预测各个迭代超步的运行时间,然后根据预测结果
针对传统电动汽车存在的动力形式单一等问题,本文基于电液动力耦合电动汽车工作原理,对主从型电液耦合载电车辆工作模式进行分析.本文提出一种新型电液动力耦合传动方法,以实现机械能、电能和液压能之间的相互转化,论述了动力耦合系统结构与组成,提出了车辆行驶过程中的6种工作模式,为验证该动力耦合系统的可行性,对各个工作模式下,主从型电液耦合载电车辆系统的电能、机械能、液压能传递和相互转化过程进行分析.分析结果表明,在提出的6种工作模式下,该系统凭借行星齿轮无级调速和功率分流的特点,能够实现3种不同能量之间的相互转化.
随着大数据和机器学习的火热发展,面向机器学习的分布式大数据计算引擎随之兴起.这些系统既可以支持批量的分布式学习,也可以支持流式的增量学习和验证,具有低延迟、高性能的特点.然而,当前的一些主流系统采用了随机的任务调度策略,忽略了节点的性能差异,因此容易导致负载不均和性能下降.同时,对于某些任务,如果资源要求不满足,则会导致调度失败.针对这些问题,提出了一种异构任务调度框架,能够保证任务的高效执行和被执行.具体来讲,该框架针对任务调度模块,围绕节点的异构计算资源,提出了概率随机的调度策略resource-Pi