一种基于傲腾固态盘的键值存储系统的研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zboboz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
键值数据库由于其结构简单、查询速度快,具有高可靠性和高扩展性的特点,·得到了广泛的应用。各类应用对键值存储系统读写性能的要求也越来越高,要求存储设备提供更快的读写性能。Intel公司为了解决SSD和内存中存在的巨大性能差异,推出了Optane系列产品。傲腾固态盘作为非易失存储器的硬盘产品,有良好的读写性能同时随机读写与顺序读写性能差异不大。传统的键值存储系统采用LSM-Tree(Log Structure Merged Tree)将随机写转化成顺序写来提高系统的性能,但在新型介质傲腾固态盘下带来的收益有限。KVell采用内存和傲腾固态盘混合使用的方式,把索引信息记录在内存、数据记录在固态盘中,获得良好的性能,但在数据量过大、索引信息无法全部存入内存时读写性能下降明显且尾延严重。
  本文基于傲腾固态盘优秀的随机读写性能,放弃了传统的LSM-Tree的数据结构,采用类似于B+树的数据组织方式,设计了一个BagTree的数据结构。一方面,BagTree使用树型结构组织数据,通过给叶子节点增加背包节点来扩充其容量的方式,保证了叶子节点空间合理利用的同时也灵活的控制了树形结构里中间节点的数量,使得BagTree能在内存较小时也正常使用。另一方面,BagTree使用多层结构的私有缓存,通过给不同层缓存结构设置不同的淘汰级别以及淘汰算法,使得BagTree树形结构的中间节点常驻内存,叶子节点和背包节点通过多层LRU的方式进行缓存替换,以提高存储系统的效率。
  测试结果显示,BagTree的随机读性能是LevelDB的30倍,是rocksDB的20倍,是KVell的1.7倍,随机写性能是LevelDB的3倍、RocksDB的2倍,略好于KVell。YCSB测试中,在单线程单队列测试,BagTree读性能是LevelDB和RocksDB的2倍以上,写性能是LevelDB和RocksDB的6倍以上;在多线程多队列测试,BagTree性能最高达到1441KIOPS,性能是KVell的2倍,且尾延也低于KVell。
其他文献
木材作为主要的建筑、家具和生物质能源材料,广泛应用于工业生产与人类生活。木材主要由茎的次生木质部发育而来,而在细胞层面上则主要由植物细胞壁组成。而植物细胞壁则主要由初生壁和次生壁组成,其中次生壁积累的生物质占植物生物质总量的绝大部分,所以理解和研究植物次生细胞壁生物合成机理,不仅对植物次生发育的基础研究具有重要的科学意义,而且为选育符合人类生产和生活所需的林木新品种打下坚实的基础。  近十年的研究
学位
结肠癌发病率和死亡率在世界范围内居高不下,也是我国最常见的消化道恶性肿瘤之一,因此阐明结肠癌发病的分子机制对临床诊断和治疗结肠癌具有一定的启示作用。由DNA结合蛋白抑制因子(Inhibitor of DNA binding1,ID1)基因转录翻译出的Id1蛋白在多种肿瘤组织中异常高表达,与癌症的侵袭性及患者不良临床预后相关。增强子是指能够增强启动子活性从而增加基因转录频率的DNA序列,近年来大量研
学位
10万立方米变壁厚浮顶储罐广泛用于石油和化工领域的油气储存,为便于储存和运输,大型储罐多建造在沿海沿江地区,这就会导致储罐产生不同程度的沉降变形,其中尤以罐周的不均匀沉降对储罐结构的影响最为严重。研究使用先进的在线监测技术对大型储罐罐周不均匀沉降进行实时监测,获得了现场实际沉降数据,结合新提出的储罐基础沉降预测方法,利用傅里叶级数展开对沉降数据进行处理分析得到谐波拟合曲线,并利用有限元分析方法,计
学位
能源与环境危机推动了内燃机代用燃料的发展。天然气由于来源广泛、使用方便得到了较为广泛的应用,但是其较慢的火焰传播速度限制了天然气发动机热效率的进一步提升。氢气由于火焰传播速度快的优势被应用于与天然气的掺烧,天然气-氢气掺混燃料逐渐成为研究热点。但是现阶段我国面临的氢气制备成本及运输储存安全性等问题限制了其作为内燃机代用燃料的广泛应用。在发动机上通过废气余热催化裂解甲醇,不仅能够解决氢气大规模制备、
学位
连续旋转爆轰发动机具有结构紧凑、热力循环效率高、自增压、推重比大等优点,在航空航天推进系统中具有广阔的应用前景,近年来成为全世界范围内的研究热点。本文以火箭式连续旋转爆轰发动机为研究对象,分别以气态氢气和液态汽油为燃料,空气和富氧空气为氧化剂,通过实验和数值模拟,对连续旋转爆轰发动机爆轰特性和推力性能展开研究。  为了研究H2/air连续旋转爆轰波的起爆与传播特性,在不同工况下开展了一系列实验研究
PN结二极管是一种常见的简单器件,同时也是研究其他半导体器件的基础,大部分PN结二极管模型都只有解析模型而没有电路实现,另外模型无法同时满足复杂性和准确性。本文综合半导体物理、电网络理论并结合目前的研究热点-分数阶微积分,通过用分数阶矢量匹配法拟合全电流方程,并结合频域非线性最小二乘法优化非同元次项系数,进而推导出一种新的PN结长基二极管分数阶模型,通过求解超越方程和用反向恢复法提取两个模型参数。
学位
我国西南地区已建成了多个超千万千瓦级水电基地,形成了跨流域、跨电网互联的超大规模水电系统,呈现出梯级规模大、巨型电站多、集中程度高、送电范围广、水力电力耦合紧密等不同于常规水电系统的独特特征,给其调度运行带来了巨大挑战,具体表现为:1.西南水电站群的发电能力远超当地电网的负荷水平,需要远距离跨省区输送至多个电网进行消纳、响应多个电网的负荷需求,面临电网负荷水平差异下的多电网调峰问题;2.西南水电站
AlGaN作为直接带隙的宽禁带(3.4eV-6.02eV)半导体材料,具有优秀的光电性质、高热稳定性和热导率、优良的介电特性和高机械强度,可以用来制备高性能电学器件和光电器件。纳米材料由于内部晶体周期性被破坏,在光电等邻域,表现出了比体材料更加优秀的性质。目前, AlGaN纳米材料及相关器件仍处于研究阶段,各种工艺下制备的AlGaN纳米材料的质量有待提高,其生长机理和模型还需要进一步地研究和完善。
学位
在过去的几年中,DNN已被证明是解决许多实际问题的通用有效工具,使用DNN的应用数量呈爆炸式增加。DNN推理业务已开始成为云计算环境所提供的服务之一,低延迟,高准确度的响应质量成为服务提供者的目标。受深度强化学习在AI领域的良好变现,人们也尝试用深度强化学习方法来实现DNN推理业务系统的高质量响应。本文主要研究以下几个问题:1.基于深度强化学习的DNN业务调度。如今,这些问题中的大多数都是通过精心