基于非易失性内存的分布式文件系统研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:LJC21102309
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,新兴的非易失性存储器(Non-Volatile Memory,简称NVM)具有可按字节寻址、掉电数据不丢失、读写性能接近DRAM等特点。NVM存储器的一个重要应用领域是搭建高效的分布式内存文件系统。如何扩展NVM存储容量并减少NVM的读写性能开销是一个关键问题。远程直接数据存取(Remote Direct Memory Access,简称RDMA)技术为解决这一关键问题提供了可能性。虽然现有的分布式内存文件系统利用RDMA网络和NVM存储器获得了更高的读写性能,但是仍存在冗余的数据复制和消息通信,无法充分发挥新兴硬件的优势。为此,本文提出一种基于NVM和RDMA的分布式内存文件系统Nebula,与现有的分布式内存文件系统相比,Nebula提升了数据访问性能和空间利用率。为此,本文的主要贡献如下:(1)客户端自治数据I/O机制。针对客户端对远程存储节点的数据访问请求,客户端利用元数据存储节点记录的物理地址,通过RDMA单侧读写直接访问文件数据块在数据存储节点中的物理内存,避免在数据存储节点的本地文件系统查询文件数据块索引的开销。为优化数据访问性能,Nebula利用索引预取和空间预分配将元数据保存在客户端缓存中,降低客户端请求元数据存储节点查询索引的通信频率,从而进一步提升数据访问性能。(2)多粒度内存空间管理机制。现有的分布式内存文件系统都将文件的数据块大小配置为固定值,无法在系统运行期间动态地调整文件数据块的大小,难以适应多变的文件增长模式,导致NVM空间利用率降低或元数据查询开销增加等问题。对此,Nebula提出多粒度内存空间管理机制,根据写入数据的大小动态地调整文件数据块的大小,从而在保证数据访问性能的前提下提升系统的空间利用率。(3)I/O数据负载均衡机制。各存储节点间数据分布不均衡将导致部分存储节点的访问负载过大,造成多客户端抢占有限的网卡资源,降低客户端的数据读写性能。对此,Nebula筛选出NVM存储空间使用率较高或热文件数据块较多的存储节点,将其中部分文件数据块迁移至其它存储节点,从而均衡各存储节点的空间使用率和访问负载,提升系统的整体性能。本文实现了Nebula原型系统并采用开源测试工具FIO对其读写性能进行测试。实验结果表明Nebula分布式内存文件系统的读取带宽和写入带宽最高可以分别达到5974MB/s和5993MB/s,达到RDMA网卡硬件所能提供的理论最高带宽的95%以上,与现有的分布式内存文件系统HDFS、Crail和Octopus相比,读写带宽提升了15%-200%。在空间利用率方面,Nebula分布式内存文件系统的空间利用率最高可达99%以上,远高于现有的分布式内存文件系统HDFS、Crail和Octopus的空间利用率。
其他文献
近些年,随着科技的不断创新,多种多样的数字产品涌现在我们生活中。其中,数字图像资源所占比率居高不下。同时,图像处理和编辑软件尤其是人像美化软件如美图秀秀,天天P图等的
阿尔茨海默病(AD)是一种中枢神经系统退行性疾病,一旦患病便无可逆转,只能通过药物拖延,对患者的生活甚至生命都造成困扰和威胁。轻度认知障碍(Mild Cognitive Impairment,MC
知识经济时代,创新已经成为企业生存发展和获取持续竞争优势的基础与主要动力来源,在企业市场竞争和国家经济发展中的地位变得越来越重要。当前科学技术迅猛发展以及产品生命
织物平整度等级是评级织物外观性能及其内在抗皱性能的重要指标,对生产过程中的质量控制以及交易过程中消费者的选择具有重要导向作用,因此需要正确评价织物平整度等级。目前
多不饱和脂肪酸和类胡萝卜素因其在食品和医药领域的广泛作用而得到人们极大的关注,当前利用微生物发酵生产多不饱和脂肪酸和类胡萝卜素具有诸多优点,由于酵母生产迅速且生物
超连续谱光源的宽光谱、高亮度以及良好的空间相干性使得它在光谱学、光纤通信、计量学以及生物医学成像等领域有着重要的应用价值。光纤放大器中输出超连续谱是目前获得高功
自准晶被首次揭示以来,准晶材料的物理性能以及缺陷(裂纹、孔洞、夹杂)问题一直是物理、力学以及数学工作者们关注的热点问题。准晶材料的应用常常与其稳定性有关,而导致准晶
混沌信号由确定性系统产生,具有较复杂的运动形态。鉴于混沌运动的复杂性,传统观念认为混沌不存在解析解。然而,一些学者通过大量的理论推导,发现了一类存在解析解的混沌系统
本文研究了一株从玛咖根际土壤中分离筛选出产抑菌多糖的野生菌,根据其菌落与孢子形态特征和28S rDNA鉴定确定该菌为尖孢镰刀菌(Fusarium oxysporum),并对该菌株产抑菌多糖能力
随着信息产业的迅猛发展和互联网技术的不断普及和深入,我们正逐渐步入大数据时代,这将加剧对计算能力的依赖。在此大背景下,量子计算作为一种具有巨大运算潜力的新型计算模