基于RDMA的分布式内存数据库查询引擎

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:naizhi1006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代日益增长的数据量的存储需求和海量数据处理需求导致分布式数据库系统的研究已经成为业界最新的热点问题。分布式数据库拥有优秀的扩展性,可以有效利用多核多机的计算和存储能力。同时,因为近年来内存价格的不断降低,操作系统也可以支持更大的地址空间,研发完全采用内存作为的存储引擎的分布式内存数据库得以实现。然而,由于传统的TCP/IP网络协议栈天然的复杂性,使得内存读取速度和网络传输速度的差距越来越大,网络IO替换磁盘IO成为了分布式内存数据库系统中新的瓶颈,影响了分布式系统的扩展性,制约着分布式内存数据库的性能。随着拥有比TCP/IP网络更高的吞吐量和更低的延迟的远程直接数据存取(RDMA)技术的日益成熟,利用RDMA技术改善分布式内存数据库系统中的网络环境的方式变得越来越流行。本文以实验室自主研发的分布式内存数据库系统Goldfish为背景,采用RDMA网络技术替换查询引擎中传统的TCP/IP网络,设计并实现了基于RDMA的分布式内存数据库查询引擎,提高了分布式查询引擎执行任务时数据传输速度,减少了查询时间。论文主要完成了三个方面的工作:1)研究RDMA网络中各种数据发送和接收模式,分析其主要优缺点,基于RDMA Verbs API,设计并实现了两套基于RDMA的高吞吐或者低延迟的数据发送框架。2)RDMA技术的一项优势是可以避免应用程序和内核态的数据拷贝,是因为RDMA在发送或者接收数据前,需要提前向RDMA网络注册内存作为发送或者接收缓冲区。针对RDMA使用缓冲区的这种方式,设计并实现了一套的缓冲区内存池管理策略,能够快速分配缓冲区。3)设计并实现了基于高吞吐和低延迟的RDMA网络发送框架和缓冲区内存池的分布式内存数据库执行器,能够接受查询优化器下发的执行计划,并保证任务被快速、准确地执行。最后,本文基于RDMA网络发送框架实现了回射服务器,在Mellanox网卡上同采用TCP over InfiniBand作为底层网络的回射服务器进行对比测试。测试结果显示,基于RDMA的回射服务器比明显基于TCP的回射服务器吞吐量更高、延迟更低。同时,采用TCP-H数据集,将基于RDMA实现的Goldfish-RDMA与基于TCP实现的Goldfish-TCP和开源的SparkSQL进行比较,Goldfish-RDMA的查询性能优于Goldfish-TCP和SparkSQL。
其他文献
农民政治行为研究有两种分析框架,"底层社会与抗争性政治"分析框架渊源于农民政治行为"顺从与反抗"的经典模式,关注底层社会及其抗争性行动。"基层社会创造性政治"分析框架从
一些微积分教材没有对级数乘积的定义,而是直接研究两个级数的项所有可能的乘积组成的级数,在此情形下讨论两级数相乘的条件并无意义,而且难免会给教学带来不便.基于这样的考
现阶段,由于我国教育体制改革的不断深入,对当前高中英语教学也带来了一定的冲击与挑战,导致其发生了巨大的变化。基于当前新课改的背景,如何更好地提升高中英语教学质量,也
从我国棉花市场风险特点殷棉花产业链特点出发.撼出了我阐棉花市场预警系统建设的基本原则与目标模式.并设计了一套快速有效的棉花市场风险测廑与评价指标体系.为我国棉花产业的
本文通过对钢坝闸与直升平面钢闸的对比,分析了钢坝闸门的优势,描述了钢坝闸门在团结水闸中的具体应用。
经营权与控制权分离引发的代理问题是催生独立董事这一群体的制度根源。引入独立董事制度,维护公司整体利益,尤其是关注中小股东的合法权益不受损害,是监管机构改善公司治理
大学生学习投入水平高低是学业成就的重要预测因素。文章通过从学习行为投入、情感投入、认知投入维度分析大学生学习投入的影响因素,给出学习投入影响因素与大学生学习投入
目的 建立五黄膏中没食子酸的含量测定方法。方法 采用高效液相色谱法,以甲醇-0.1%磷酸溶液为流动相,梯度洗脱;流速为1.0 mL/min;检测波长为270 nm。结果 没食子酸的线性范围为
西瓜是一种在世界范围内广泛种植的园艺作物,中国是世界上最大的西瓜生产国和消费国,对西瓜遗传育种的研究具有重要意义。遗传图谱是进行基因定位、图位克隆、分子标记辅助育
目的:研究五黄膏抗炎镇痛效果。方法:SD大鼠90只,随机分为足跖肿胀实验组、耳廓二甲苯致炎实验组、扭体实验组。各组再分别分为五黄膏组、模型组、太宁组,观察五黄膏抗炎镇痛效