基于LSM-tree的键值存储系统的研究与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:ya4516623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据存储领域呈现出数据规模日益增大、非结构化数据迅猛增长等趋势,这使得传统的关系型数据库难以满足许多互联网应用的数据存储需求。键值存储系统因其扁平的数据组织方式和出色的水平扩展性,被广泛用于各种数据密集型应用中。但随着数据规模和读写请求的不断增长,键值存储系统也存在着写放大、读放大等问题。论文对此展开了研究,主要针对基于LSM-tree(Log Structured Merge Tree,日志结构合并树)的键值存储系统的性能进行优化。本文的主要研究工作和贡献包括:(1)提出了基于键值类型的差异化管理方法:虽然LSM-tree的写性能较好,但为了维持系统的读性能和减少空间放大,需要定期对磁盘上的数据执行合并操作。而合并操作会产生大量的磁盘I/O开销,导致严重的写放大,进而影响系统的吞吐量。针对写放大问题,本文提出了一种差异化的键值管理机制,根据值大小对键值对进行分类,对不同类型的键值对实行不同的存储和垃圾回收方案,并基于此机制实现了存储系统Luc Key。通过差异化的键值管理机制,Luc Key在保证范围读性能的同时减小了写放大问题。(2)提出了自适应缓存优化机制:虽然Luc Key通过差异化、细粒度的键值管理机制减小了写放大问题,但由于LSM-tree的结构特性,系统还存在着读放大的问题。为进一步提高读性能,本文提出了自适应缓存机制,并将其在Luc Key之上进行实现。自适应缓存主要包括Hot Cache和Warm Cache两个组件,分别用于缓存访问频次较高的数据和访问频次较低的数据,并能根据工作负载的变化动态调整二者的大小。对于不同类型的键值对,缓存中存放的对象也不同,这种根据键值对类型实行差异化的缓存策略在性能和空间使用上取得较好的平衡。(3)对上述提出的方法进行了实验验证。实验结果表明实现了基于键值类型差异化管理的Luc Key在点读、写入、范围读等方面都取得了较高的性能,在混合工作负载中也有着较为均衡的性能;自适应缓存优化使Luc Key的读性能进一步提高,并能随工作负载的变化对缓存进行自适应调整。
其他文献
随着以新能源为主体的新型电力系统的构建,发电侧出力的不确定性增强和用户侧负荷的快速增长,使得电力供需关系日趋紧张,电力系统的规划与运行面临着新的挑战。用户侧灵活可控的资源可以通过需求侧响应项目与电网双向互动,然而海量分散的用户负荷的响应潜力亟待挖掘。在此背景下,本研究站在电网公司的立场,面向需求侧响应实施过程中对隐私关注程度不同的典型用户,应用图神经网络技术,在三种情境中分别基于可获得的负荷数据实
区域供冷系统规模较大、系统结构形式复杂,其优化运行和故障检测诊断一直以来是极具挑战的问题。建立精准可靠的区域供冷系统数字孪生模型可为系统的高效运维提供决策支持信息,也是实现整个系统优化运行、进行故障诊断的重要前提。数字孪生模型的建立依赖于模型校准工作。目前,围绕区域供冷系统模型校准问题学术界已经开展了大量研究,但是这些方法大多针对简单的单体模型,对于整个系统层面宏观考虑所有的单体模型在一起的非线性
植入式给药能够提高局部药物浓度,降低全身性给药带来的不良反应,近些年受到研究者们的高度关注。有源植入式给药系统具有良好的给药可控性,但生物相容性较差,发展生物相容性良好的无源植入式给药系统成为领域内的一个研究热点。目前得到商业化应用的无源式植入式给药系统主要是由合金、脂质体、纳米粒子等材料组成,只能实现简单的缓释,具有良好控释性能给药系统的在产业化过程中还面临着诸多困难。其中,给药精度、体内传感和
随着城市的发展,屋顶光伏电站逐渐具有了很大的规模,为了提高城市空间利用率和光照使用时长,屋顶光伏面板主要分布在大型工厂和大型仓库的顶部,其建造特点是光伏面板分布面积广,倾斜角度小,难以布置大型清扫装置,而定期对光伏面板清扫对提高发电效率具有重要意义。随着人工成本的逐年增加,用清扫机器人取代工人来进行光伏面板的清扫已成为发展的必然趋势,但是针对于屋顶电站的清扫机器人并没有深入的研究和设计。针对这一问
微网中电力电子装备始终朝着高频、高效、高功率密度的方向发展,要求电流传感技术具有高带宽、隔离和小型化特点。一种满足上述要求的电流传感器是隧道磁电阻(TMR,Tunnel Magnetoresistance)传感器,它通过感应磁场实现非侵入式电流测量。然而,TMR电流传感器在应用过程中,存在以下三方面问题:1)带宽受集肤效应影响,2)变换器dv/dt引起传感器输出尖刺,3)干扰磁场造成传感器输出畸变
随着传统燃油车污染排放问题的日益严重,电动汽车因其零碳排放、节能和高性价比等特点受到社会的广泛关注。然而,目前电动汽车有线充电方式存在充电站数量过少、充电所需空间较大、时间长、雨天充电不安全等限制,因此最新的研究聚焦于电动汽车无线充电方法,其具有空间利用率高、充电便利性高、后期维护成本低等优势。本文针对电动汽车恒流恒压无线充电技术开展研究,深入研究剖析无线充电系统补偿网络架构,并提出了无线充电恒流
作为一种在多层神经网络上通过各种机器学习算法来解决图像、文本等应用问题的方法,深度学习在科学及商用领域得到了广泛的运用。当前的深度学习方法,很大程度上还是依赖于数据驱动,用作训练的数据集越大,在一定程度上就能得到更高的模型准确率。近年来,互联网上可使用的数据资源愈加丰富,模型训练可使用的数据集体积也日益增大,这对存储系统的I/O性能提出了新的挑战。传统的存储介质和存储系统给深度学习训练任务带来了严
随着环境问题的日益凸显,可再生能源的合理高效使用成为能源体系转型中的重要议题。微电网组网技术作为可再生能源高效利用的重要途径,需要具有可靠性高、灵活性强等特点,可以助力实现可再生能源高质量供电。本文以微电网多源组网控制关键技术为主题,主要针对孤岛微电网中组网过程中的并机模式切换、无功分配和惯量控制开展研究。针对微电网组网过程中电压源型逆变器并机平滑切换的需求,本文提出了一种基于下垂控制的变步长预同
随着社会的不断发展进步,对电力的需求量与日俱增,对电能质量的要求不断提高。不断扩大的电网规模、愈发复杂的电网结构使得调度运行任务变繁重的同时也增加了电网中的风险。温州电力调控中心作为温州电网运行中的技术支撑平台,现行的调度方法和调度信息系统已经很难满足日益增长的需求。此外,近年来温州地区自然灾害频发,已经对电力系统的正常运行造成了不可忽略的影响,尤其是台风、暴雨及雷电对电网的影响最为严重。因此,有
集团化办学是推动义务教育均衡发展的重要举措之一,推动了教育资源的整合,也扩大了优质教育资源的辐射范围,更促进了教师专业发展水平的提升。而教师专业发展对集团化办学又具有反作用。文章基于集团化办学的特点,从融合的角度,结合长期的实践经验,研究了集团化办学背景下的教师专业发展的策略、成效与不足,并提出了针对性的改进措施。