基于A*算法的分组多查询优化研究与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:a1986431230xinglixue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多查询优化是加速高并发查询处理的重要方法。传统的多查询优化方法面向强相似性查询输入场景,通过各类启发式搜索策略快速获得全局近似最优解。其中,基于A*算法的多查询优化算法是传统多查询优化算法的代表,有大量研究对其进行了改进和优化。然而这些方法无法应对场景中可能出现的大量弱相似性查询。同时优化这些查询时,查询间可共享部分少,可选择的组合多,从而可能导致多查询优化的开销大于收益,无法获得较好效果。因此本文针对传统多查询优化算法在弱相似性查询输入场景中性能低下的问题,提出基于A*算法的分组多查询优化算法并在Impala系统中进行了集成。首先分析基于A*算法的多查询优化算法,并提出一种分组策略对其进行改进,加速其在弱相似性查询场景中的处理过程;接着,通过修改Impala系统的查询处理过程使其支持多查询优化,并将改进的算法集成到系统中。最后从多查询优化算法性能和分组策略执行效率两个方面在TPC-DS数据集上进行了对比实验。实验结果表明本文提出的方法能加速多查询执行过程,有效提升查询性能。
其他文献
隐式多项式曲线,尤其是高次隐式多项式曲线对物体几何模型的描述非常有效,它用很少数目的参数就能描述形状不规则的物体,其稳定性和不变量的鲁棒性可用来快速有效地识别物体。在
随着网络信息技术在管理上越来越深入而广泛的应用,基于WEB的数据库信息管理系统的开发在技术上已逐步成熟,并成为主流和发展趋势。同样,信息管理技术正以前所未有的速度深入
随着网络技术和信息数字化的快速发展,面向海量数据的大型应用纷纷涌现,数据中心里存储服务器集群规模随之不断增大,越来越多的存储节点,给存储系统中的元数据服务器带来了更重的
高端容错计算机是指同时具备高性能和高可用特性的高端服务器。高端容错计算机主要面向金融、电信等涉及到国家战略安全的关键领域的计算需求,此类系统的可靠运行直接关系到
四边网格在有限元模拟仿真、样条曲面、参数化以及纹理贴图等领域有着非常广泛的应用。相比常用的三角网格,四边网格不仅天然具有张量积性质,而且在有限元计算中提供了更好的
随着互联网的高速发展,越来越多的人通过网络来表达自己的意见、想法、情绪和态度,其中既包括对事件的发展有着正面、积极作用的信息,也包括一些负面、消极的信息。同时,网络
纹理烘焙是一种增加图像真实度的手段,其占用资源少,使用方式简单,有效解决了三维场景的计算机真实感图形实时绘制的速度与质量的问题。因此被广泛运用在影视动画与视频游戏
规范调控、策略驱动的自治式服务协同模型NGPD,可以解决因自治个体行为难以预测、控制而导致的协同效应“可信”危机[1]。然而,服务协同的社区应用依托于众多的中小企业的参与,
如何在分布、动态、共享的网络计算环境中,建立E机构(Electronicinstitution)去规范和约束Agent的协同行为,使得系统可信?如何表达和实施协同行为规范,使得只要个体都遵从行为规
肤色检测技术是人脸检测与识别、表情识别、手势识别、人体检测、图像与视频索引等计算机视觉系统的重要组成部分。在色情图像检测过程中,它可以起到关键作用,目前,该技术已被广