海量小文件系统基于聚合单元的空间回收和快速迁移

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:zhk42
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据规模的不断扩大,分布式文件系统以其海量数据支持、高可用、大规模并发访问和并发处理能力等优势获得越来越多的关注。基于开源分布式文件系统HDFS实现的分布式海量小文件系统SMDFS(Small Files Distributed File System)采用了聚合存储技术实现海量文件的存储。由于HDFS不支持文件的随机读写,SMDFS只能支持聚合空间的删除,实现小文件粒度的文件删除是个技术难点,且研究海量文件系统的删除技术具有一定的研究意义和应用价值。为了实现分布式文件系统中的文件删除,论文给出了元数据删除和无效存储空间整理作为两阶段实现的思路。然而现有的SMDFS文件系统从架构上文件的元数据和数据内容是分离和不紧密相关的,SMDFS可以快速从文件元数据定位到存储数据的数据块,然而从数据块追溯到文件的元数据的代价却很高,导致无效存储空间整理的难度很大。基于SMDFS系统架构的不足,论文提出了聚合单元的概念,细化聚合空间,每个数据文件对应一个聚合单元,增加了用来辅助从数据块可以追溯到元数据的小文件记录包结构,这样存储空间整理阶段以聚合单元粒度进行,极大提高存储空间整理的效率,并避免对系统整理性能造成较大影响。在元数据删除阶段,采用直接删除元数据,然后把文件删除操作记录缓存在客户端,并按照文件元数据所在的元数据簇组织操作记录。客户端定期检查缓存并将各元数据簇对应的操作记录提交至管理元数据簇的数据节点,由数据节点将记录追加到元数据簇对应的操作日志中,这样操作日志的并发问题得到有效控制,极大缩短了元数据删除的响应时间。本文给出了分布的文件碎片整理框架,采用名字节点作为任务分配者,数据节点作为任务执行者,框架分两部分:以聚合空间为单位,根据操作日志更新聚合空间下的小文件记录包并选出需要整理的数据文件;以数据文件为单位,通过遍历小文件记录包,将未删除的小文件迁移到其它的数据文件中,直接更新文件元数据,最后删除数据文件完成碎片整理。在SMDFS基础之上,基于聚合单元实现了一套分布式海量小文件系统SMDFS2.0,系统采用Client删除操作缓存机制以及Worker异常检测,进一步提高海量小文件删除的整理性能和系统的可用性。测试表明,支持文件删除的海量小文件系统SMDFS2.0与原有的SMDFS相比,文件的读写性能没有明显下降;SMDFS2.0文件删除性能较HDFS和Linux文件系统有明显优势;碎片整理时,系统的写性能会降低30%,读性能会降低18%;SMFDS2.0以聚合单元为单位数据迁移在效率上明显高于以小文件为单位数据迁移。
其他文献
新时代我国教育研究的主要命题是核心素养的培养。作为生物教学最重要的教学方法之一,探究教学在培养学生科学思维、科学探究素养等方面有巨大优势。但近年来,探究教学面临的
本文首先从我国水资源现状和常规水处理工艺技术的背景出发,综述了臭氧在水处理中的应用现状。臭氧因为其具有强氧化性及消毒作用而经常被用于水处理技术中。另外,由于臭氧氧化具有选择性的特点,臭氧化法也经常应用于某些有机物的选择性合成中。基于单独臭氧化法的缺陷和实际应用的需求,结合固体碱(MgO)的特性,提出了本文的研究内容。本论文主要分为两个部分:MgO/GF催化臭氧化降解双酚A的研究;固体碱MgO催化臭
曲线建模在计算机图形学中有着悠久的历史。曲线建模的基本目标是构建具有良好几何性质且易于编辑的自由曲线。工业设计领域中一个重要的问题是怎样构建光滑(或光顺)的自由曲
软件定义网络(SDN)得到了越来越多的关注和应用,这主要得益于它和传统网不同的特性,传统网络采用协议分层的机制,每一层只负责和自己相关的工作,SDN打破了分层的结构,主要有控制逻辑和转发处理逻辑。控制逻辑由控制器来实现,转发处理逻辑由交换机负责,此外SDN还支持编程特性,在控制器中可以编程实现新的功能,然后将相应的规则下发给交换机,控制器负责路径发现,负载均衡等功能,而交换机只负责相应报文的处理和
亲属容隐制度,作为我国法制史上一项具有浓厚人伦色彩的制度,在古代表现为亲亲相隐原则。其含义是允许一定范围的亲属之间互相隐瞒罪行,不以犯罪论处。亲属容隐制度作为一项
随着网络和通信技术的发展,移动用户设备(User Equipment,UE)的爆炸性流行加速了许多延迟敏感且计算密集的应用程序和服务的出现与发展,UE的计算、存储和网络等资源的管理优
随着国家利益拓展和“一带一路”国家战略的实施,国民经济建设和军事国防对境外高精度地理信息需求越来越迫切,依靠光学立体测绘卫星采用无控测图技术是获取境外地理信息的有
高等教育大众化改变了传统精英教育模式,高等教育数量及规模蓬勃发展。然而,发展不仅仅是数量扩张的过程,也是教育质量不断提升的过程。如何监控与提升高等教育质量一直是高
目标检测的任务是从图像中识别感兴趣目标的类别并用检测框标记其大小和位置,随着深度学习的广泛应用,目前对于图像目标检测的研究取得了巨大的进步和成果,近年来人们开始研究对视频的目标检测方法。视频是由一系列连续图像组成,其图像之间存在一定的映射关系,视频在提供更多前后文时序信息和空间信息的同时,其场景的变化也增加了许多挑战,如:目标遮挡、运动变形、光照模糊等。如果将图像目标检测方法直接用于视频的目标检测