论文部分内容阅读
随着计算能力的增强、应用课题规模和复杂度的增加,高性能计算机对并行文件系统性能要求越来越高,在海量小文件频繁创删和大规模并发I/O操作的应用场景中,文件系统元数据吞吐率成为限制其性能的关键因素。针对I/O转发架构,提出了一种基于元数据代理的高可扩展元数据服务的方案,结合作业调度系统,将文件系统元数据请求分散到多个元数据代理上,加速作业的文件系统元数据访问。并行I/O是高性能计算系统中主要的I/O使用方式,可分为单数据流模式和共享文件模式。其中单数据流模式给元数据服务带来很大负载,元数据可扩展性方案面向该I/O模式提出的,主要包括元数据代理MDDS(MetaData Delegation Service)和基于MDDS的作业调度两部分。元数据代理基于Lustre元数据集群架构CMD(ClusterMetaData)实现的,通过降低多个元数据服务间的耦合度,保证元数据集群的高可用性;使用目录子树方式管理元数据代理空间,避免跨节点目录引入的分布式原子操作的复杂性和低效性;实现元数据迁移避免跨元数据服务器间文件迁移造成的数据对象移动;通过元数据代理动态增删机制实现元数据代理的灵活部署。针对高性能计算中I/O转发架构作业调度特点,提出基于元数据代理的两种作业调度策略——单作业独占单元数据代理调度和多作业共享多元数据代理调度。前者实现了对传统作业I/O访问模式的支持,避免了多作业间元数据竞争;后者将单个作业的元数据访问分散到多个元数据代理上,实现了作业内的元数据负载均衡。在116台存储服务器上对元数据代理进了测试,同时通过模拟I/O转发架构中作业的文件系统元数据访问负载对两种作业调度方法进行评估。结果表明,元数据代理提供了拟线性的元数据性能,在大规模的环境中较CMD方案有较好的扩展性;两种调度方式有效分散了作业元数据的负载,改善了高性能计算中的元数据瓶颈问题。