基于图数据库的查询计划生成与优化研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:szjisu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,各数据平台承载了海量实体信息,准确分析隐藏在这些数据背后的复杂交织关系有助于我们进行信息推断和决策建模,这也使得数据科学家们对数据项之间多层延伸关系的查找需求陡增。图数据库把实体项作为节点模型,把关系作为边模型,采取图式数据建模,确保了多层延伸关系的查询时效性。本文针对图语言Cypher的特性进行图查询优化的研究,主要创新包含如下两方面:一方面,由于Cypher语句中的查询模式包含了查询节点与查询边,查询节点的扫描顺序以及关系边的延伸方向并不固定,查询图不同的组合方式会产生执行代价与运行效率差异明显的逻辑计划。如何制定合理的图执行代价算法和图基数估计模型作为该文创新研究之一;另一方面,通过构建合理的图数据库分布式物理计划,从而降低图数据库的并行图查询时延。设计良好的分布式图查询计划生成策略、图算子分裂模型与图算子调度优化算法也是图数据库并行查询优化的关键。为满足图数据库高效查询的需求,我们研究实现了一个基于图数据库的分布式查询计划生成、优化系统。该文研究工作及创新要点包含:(1)基于libcypher-parser语言解析框架,对图数据库支持的Cypher查询语言展开解析,产出抽象语法树(AST),并根据Cypher语句特征,建立子句分片算法模型创建关键逻辑算子,对语法树进行二次转换,构造逻辑计划树。(2)在创建逻辑计划树时,建立基于查询图代价和图基数估计的逻辑计划构建算法模型,生成查询图的若干参选临时逻辑计划,通过查询图代价和图基数计算模型预估计划代价数值,从多个参选图计划对象中选择运行代价最低的计划,完成对图数据库逻辑计划的生成优化。(3)重写逻辑计划。基于图查询表达式等价性模型,建立逻辑算子下推、逻辑算子替换、逻辑算子合并、逻辑树修枝等重写模型对图数据库计划优化重写。(4)将逻辑计划切割为多份分布式物理子计划,分发调度执行。通过为逻辑算子设计分布式图查询、图计算算子,实现物理算子的分裂和分布式协同调度策略,并设计分布式图计算算子优化算法,提高图数据库并行查询执行效率。本文末尾对图数据库分布式计划生成的过程数据和调度结果构建功能测试,并采用各梯度复杂度的Cypher语句对比检验测试了查询图基数代价算法的优化效率,包含编译时间以及运行时间等测试指标。
其他文献
属性基加密(Attribute-Based Encryption,ABE)作为一种将加密和访问控制的思想结合起来的非对称加密体制,在提供了一对多的加密方式的同时也提供了细粒度的访问控制。这些特性使得属性基加密在云计算、基于云的物联网以及无线体域网等领域得到了广泛的研究和应用。不幸的是,目前大多数的策略隐藏的属性基加密(Policy Hiding Attribute-Based Encryption
作为微分方程中很重要的一部分,分数阶扩散方程在力学,物理学上备受关注。除此之外,在化学,生物学,图像处理等众多领域也应用广泛。因为相比于整数阶微分模型,分数阶往往能够更加精确的描述其中的现象和结果,所以求解这类方程也变得十分重要。针对这类方程,一方面,由于可以作为封闭形式的解析解通常不可用,所以数值方法成了求解其近似解的主要方法。另一方面,由于分数阶算子具有非局部的性质,采用简单的离散化,即使是隐
鸟类能通过地球的磁场导航,这种功能叫做鸟类磁觉。四十多年前人们在一些鸟类的身上首次发现了这个现象。虽然磁觉四十年前就已经发现,我们对它的了解还是很有限。有一些证据支持导航功能是通过自由基对相互作用的量子效应实现的。参考探头模型是广泛应用的一个量子指南针模型,它与所有迄今为止已发现的实验结果符合。它是一个简化的分子指南针模型,自由基对中的一个电子受超精细耦合的影响,而另外一个电子则不受影响。深入了解
整数分拆是组合数学中非常重要的内容,同时它也是数论中不可或缺的一部分。关于整数分拆,人们最关心的莫过于分拆恒等式,即建立不同类型的分拆之间的数量相等关系。2019年,美国学者Andrews在整数分拆中引入一个新的统计量,称为最小缺量(the minimal excludant),用它来追踪一个分拆中缺失的最小正整数。在本学位论文中,主要通过最小缺量这一统计量对分拆理论中的一些经典的恒等式进行研究。
趋化是生态学和生物学中广泛存在的现象,它是指生物种群细胞在某种化学信号物质的影响下做定向运动。趋化运动对细胞的生存和发展起着至关重要的作用。自从Keller和Segel在1970年提出了著名的Keller-Segel模型以来,越来越多的学者开始用数学方法分析并解释这种趋化现象。本文主要考虑如下带logistic增长和间接信号产生的全抛物趋化模型(?)在齐次Neumann边界条件下解的整体有界性和长
随着自动控制、微型传感器等技术不断发展,无人机得到了快速的普及。搭载人机交互技术的无人机系统直接凭借人的直觉实现无人机飞行指挥,提升了其智能化和易用性。但当前仍存在交互距离短、易受光线干扰、场景适用性差等缺陷。本文设计了通过骨骼点识别进行人机交互指挥的方法,通过视觉惯导融合进行定位的方法,以及室内外两种位置控制方法,实现了基于人体姿态信息的无人机人机交互控制系统。本文搭建了基于ZED双目相机和TX
张量填充旨在通过部分观测到的张量元素恢复原有的张量,但是若在没有任何先验信息的情况下,我们可以有无穷多种方式去填充未观测到的元素,因此此问题是一个NP-Hard问题,但我们知道实际被观测的张量是唯一且确定的。因此,为了较好的解决张量填充问题,我们常常借助大部分张量数据具有的低秩或稀疏先验信息来辅助解决填充问题。随着人们对数据清晰度要求的增加,我们追求更加精确的张量填充模型,本文通过对张量填充模型进
信息技术的飞速发展使得具有不确定性的数据爆炸式的增长,越来越严峻地考验着人们的数据收集和分析能力。面对大数据所带来的信息系统的不确定性,不确定性度量的有效构建便成为研究数据挖掘和知识获取的重要课题。模糊集理论、粗糙集理论和信息熵理论作为处理不确定性信息的有力数学工具,提出了很多切实有效的约简算法。本文以模糊集的一个分支——直觉模糊集为基础,研究其等价类的层次构建和属性约简问题,以及其相似度量在直觉
小波分析作为傅里叶变换的延申,其在Hilbert空间中的应用诞生了一个新的研究方向-框架理论。框架理论作为基的一种推广,因其卓越的冗余性被广泛的应用于信息处理、图像处理、数据压缩、数学建模、通信和编码等方面。在信号处理的应用中,需要传递的信号经过基的加密后,在传输过程中容易出现丢失、乱序以及噪音干扰等现象,并且很难找到合适的向量来重构信号,而用框架来加密信号,如果出现丢失现象,只需要找到其对偶框架
矢量径向基函数由径向基函数拓展而来,利用旋度和散度算子作用于径向基函数,得到无散度和无旋度的矢量径向基函数,同时保留了径向基函数各向同性、形式简单以及无网格等特点,在求解偏微分方程数值解方面有重要应用。本文主要利用无散度矢量径向基函数,结合虚拟点研究取点对插值效果的影响,并将此方法推广到求解Navier-Stokes方程数值解中。首先,介绍研究的背景、现状及意义,简述本文需要用到的基本定义和理论基