分布式文件系统中客户端存储资源预取关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:baozhengzzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越广泛的海量小文件应用,对传统分布式文件系统提出了低延迟的挑战。由中国科学院计算技术研究所基于pNFS自主研发的客户端可写的元数据缓存系统,采用客户端缓存技术,对小文件创建过程中元数据访问性能进行优化,优化后相比于pNFS,小文件创建性能可提升2~128倍。然而,现有客户端可写的元数据缓存系统存在两个问题,第一个是客户端预取的存储资源在异常宕机情况下存在丢失不一致的问题,第二个是海量小文件在多个数据卷上的分布影响文件访问性能。本文针对现有系统存在的两个问题,分别设计了低开销的存储资源一致性维护协议和低访问冲突的动态存储资源分配策略,并应用到现有系统。本文工作和贡献如下:  本文提出并实现一种低开销的存储资源一致性维护协议,该协议能够在正常操作过程中低开销地维护存储资源一致,在宕机恢复过程中轻量级地恢复存储资源一致。该一致性维护协议采用数据块预分配策略,减少了频繁修改数据块位图的写磁盘开销,通过维护预分配范围的数据块和预留范围的索引节点绑定关系,MDS在后台以轻量级FSCK的方式仅扫描小范围的索引节点就能恢复存储资源一致。测试结果显示,相对于数据块预留策略,该一致性维护协议正常操作的执行延迟,可降低13.42%~19.76%;在预分配1GB数据块资源、预留1万个inode的情况下,MDS恢复存储资源一致的时间小于1秒,且恢复期间对CPU负载影响仅在0.1%~0.3%、磁盘负载影响仅在0.01%1.6%。  本文提出并实现一种低访问冲突的动态存储资源分配策略,该分配策略使得单客户端能有效利用多个数据卷的性能,同时降低数据卷上的访问冲突,从而降低了客户端创建文件的延迟。此外,该策略支持根据数据卷负载变化,动态调整数据卷,发挥整体数据卷性能。在该分配策略中,MDS根据数据卷的I/O请求响应时间,为客户端选择一组响应时间小的数据卷分配存储资源,同时支持根据I/O请求响应时间阈值条件,动态调整客户端所使用的数据卷组,发挥整体数据卷性能。测试结果显示,相对于原有分配策略,现有分配策略中客户端创建文件时间可降低9.46%~19.44%。
其他文献
DTS是基于软件缺陷模式的静态测试工具,采用了函数摘要的相关方法进行过程间分析,但目前由于函数摘要中缺少路径信息,缺陷检测往往存在一定的误报和漏报。本文针对这种问题提
MapReduce是由Google提出的一个广为人知的编程框架,Hadoop开源实现了这一框架。因为MapReduce适合处理大规模数据,许多企业都采用其进行数据挖掘,数据存储等。MapReduce需要
随着融合网络技术的不断发展,新的业务和服务不断涌现,并呈现出多样化、个性化的发展趋势。与此同时,作为业务载体的终端设备也日益类型多样化、功能复杂化。如何对融合网络
BI PaaS平台是将云计算、平台即服务、商业智能技术的综合运用。它以云计算的强大并行计算和分布存储能力为支撑,将ETL,数据挖掘,OLAP,报表等各类BI能力进行云化,并以图形界
以Internet技术为代表的信息革命正在深刻地改变着我们身边的生活和世界,可以说,互联网的出现为世界的经济发展和社会进步起到了巨大的推动作用。但与此同时,互联网作为一个
下一代互联网IPv6协议克服了IPv4协议的许多缺陷,使其能够更好的适应互联网的发展要求。但是要使IPv6网络代替现有的IPv4网络还需要经历漫长的过渡发展阶段。为了实现IPv6网
随着计算机网络的不断快速发展和广泛应用,维护网络环境的安全已经变得越来越重要。而且由于当前IPv4地址资源不足,IPv4向IPv6过渡已经成为必然。IPv4技术已经成功的在Intern
Internet的一个重要功能是信息的交流和共享,而查询检索又是获取信息的主要方法.网络技术和Web的快速发展给设计开发有效的网络资源检索工具提出了更高的需求.在纵 观国内外
恶意软件从早期的简单病毒、蠕虫逐步进化发展成实现特定目的木马、Rootkit等高级形态,并在网络空间中肆意传播,对用户的计算机系统造成严重的危害。对“暗云”木马、“海莲花
在远程教育管理系统中,远程教育模式按单点或多点、非实时或实时、非交互或交互可分为八种模式.这八种模式的划分实质上就是目前移媒体技术中的CSCW(Computer Supported Coop