面向深度学习训练场景的分布式缓存方法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:beiebi3807b
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习神经网络在各领域的广泛应用,数据集和神经网络模型规模越来越大,一个数据集可达百万甚至千万级文件规模,且大部分为几十KB或几百KB的小文件。针对海量小文件进行大规模深度学习训练是深度学习技术发展的重要趋势。深度学习训练任务具有I/O密集型访问、随机访问、迭代扫描等特征,在短时间内会产生海量I/O请求。传统的分布式存储系统主要面向大文件存储,无法应对深度学习训练场景的大量并发访问。现有分布式缓存系统在面向海量小文件存储与管理时主要采取文件合并、共享缓存、以及自适应缓存替换算法实现高性能缓存。但未考虑到深度学习训练任务的随机访问、迭代扫描等特征,目前仍然存在以下问题:(1)随机访问导致的IO性能瓶颈问题。现有的小文件合并方法与缓存策略主要为了解决海量小文件的存储与管理问题,并未考虑深度学习训练场景随机访问特性,仍然会产生海量I/O请求从而造成I/O性能问题。(2)迭代扫描导致缓存命中率低的问题。现有的缓存替换算法大多针对近期性或频率性特征突出的负载,通过保存热点数据从而提升缓存性能。但深度学习具有迭代扫描特征,若采用现有缓存方法,缓存区会保存大量过期数据,从而导致数据读取时缓存命中率低。本文针对上述问题,对现有分布式缓存方法进行改进,具体工作如下:(1)面向深度学习训练场景,针对海量小文件随机访问导致的I/O问题,本文基于文件合并,以及分布式二级缓存思想提出了DDCache(Distributed Dual Cache)方法。该方法支持深度学习训练的随机访问场景。首先在数据准备阶段本文提出拟合batch size特征的文件合并方法,以提升I/O性能。其次,在数据shuffle阶段提出基于chunk缓存状态的双层shuffle策略,将shuffle转移至缓存层,解决海量小文件随机读取的I/O性能瓶颈问题。最后,在深度学习任务训练阶段,本文提出二级缓存策略和异步预读,以加速缓存数据访问并提升缓存命中率。经实验验证,DDCache方法对比Alluxio系统传统文件读取方法,显著提升了I/O性能,不仅减少了深度学习训练的迭代时间,而且提高了缓存命中率。(2)面向传统工作任务与深度学习训练任务混合执行的场景,针对深度学习迭代扫描导致的缓存命中率低的问题,本文基于分区元数据管理,以及自适应分区空间大小思想,提出PACRA(Partition Adaptive Cache Replacement Algorithm)自适应缓存替换算法。首先,提出基于自适应分区的缓存数据管理方法,实现缓存分区数据管理与动态可变分区大小。其次,提出两种基于分区数据管理的抗扫描子策略:PLRU(Partition Least Recently Used)和PLFU(Partition Least Frequently Used),以适应混合任务场景。最后,采用基于缓存缺失的遗憾最小化策略管理PLRU和PLFU,实现自适应缓存管理。经实验验证,PACRA缓存算法对比Le CAR算法、ARC算法、LRU策略和LFU策略,提升了缓存命中率,同时对比Le CAR算法减少了缓存计算时间。本文设计并实现了基于文件合并的分布式二级缓存方法DDCache、与基于任务负载特征的自适应分区缓存算法PACRA。在面向深度学习训练的场景下,解决了随机访问导致的IO性能瓶颈问题与迭代扫描导致缓存命中率低的问题。实现了面向深度学习训练场景的高性能缓存。
其他文献
党的十九大提出“要构建市场导向的绿色技术创新体系,壮大节能环保产业”。传统燃油汽车的大量使用使全球能源短缺,环境污染等问题日益加重,具有节能,环保优势的新能源汽车应运而生。在政府补贴的大力支持下,我国新能源汽车产业得到迅速,大规模的发展。2019年,我国新能源汽车产销量自2011年以来首次出现下降,政府补贴滑坡是重要原因之一。鉴于此,四部委联合发布《关于完善新能源汽车推广应用财政补贴政策的通知》(
学位
个人信息保护中的同意规则是建立在意思自治、个人自决权之上的一项规则,其根植于自主价值,是个人信息保护之基石。同意规则作为个人信息保护中最为核心的制度设计,在我国个人信息保护相关的立法和司法实践中得到了广泛地应用。但在大数据时代,同意规则的适用却面临着诸多实践困境。虽然《民法典》于人格权编对同意规则进行了相应的规定,但其规定仍然较为笼统,无法全面回应司法实践中出现的种种问题,容易使个案的司法裁判出现
学位
《义务教育英语课程标准》(2022版)提出了九年义务教育结束时,学生在英语写作方面应达到的具体要求。然而,我们的学生顺利达到这些要求的情况不容乐观。人们普遍认为目前的教学和学习模式及评价方法可能会阻碍学生在英语写作方面取得进步。这些写作课通常以教师为中心;学生不明确写作目标;写作评价方法缺乏鼓励性且写作效果和效率有待提高。基于此背景,笔者试图运用成果导向教育模式帮助目前的写作教学走出困境。美国学者
学位
报纸
随着科学技术的进步和机器人高新技术的应用,冗余机器人因构型灵活、动作精准,具有空间复杂化和任务多样化优势。因此本文以冗余机器人为研究对象,通过对其控制和调度技术研究,为弹药智能化转运技术的实现迈进了一大步,为大口径舰炮弹药转运技术的发展提供支持。关于舰炮弹库机器人的控制。首先,采用改进DH参数法建立正运动模型;采用智能迭代方法,从速度层面分析,解决了逆运动学数值解存在多解和累积误差,及关节奇异回避
学位
心血管等疾病的预防和治疗是现代社会面临的重要医疗问题,老龄化程度加深、医疗资源不足等现状使得这个问题更为严峻,而家庭健康监护可以作为疾病预防、干预的有效补充,其重要意义越发凸显。现有的家庭健康监护产品种类还不够丰富,功能单一,使用便捷性不足。本文针对家庭内使用场景的需求,设计了一套生理信号采集与处理系统,该系统可以采集心电、呼吸、体温、脉搏波等在家庭健康监护中具有重要意义的生理信号以及惯性信号,采
学位
自十九大以来,乡村建设已然成为社会主义现代化建设的重中之重,但乡村社会治理问题也是全面深化改革中的难点所在。区域经济发展不平衡、城乡贫富差距大、自然生态环境遭破坏都对乡村社会治理形成严重的打击。2019年中央印发《关于加强和改进乡村治理的指导意见》意见明确指出乡村有效治理是实现乡村振兴的重要内容。紧接着2020年中央一号文件贯彻落实党的十九届四中全会精神,强调要“加快推进乡村治理体系和治理能力现代
学位
结合现阶段国产皮革化工的现状,近几年国内皮化抓住机会,使其有了质的提升,反之国外化工材料价格涨幅大,不稳定,这给国内皮化的发展带了很大的机遇,国产化工应该依据市场情况,专注研发,发展趋势,加强人才培养,提高自己价值。
期刊
习近平总书记指出,完善和发展中国特色社会主义制度,推进国家治理体系和治理能力现代化是坚持和发展中国特色社会主义的必然要求,也是实现社会主义现代化的应有之义。推动乡村社会建立和完善数字治理体系是实现国家治理能力和治理体系现代化的重要组成部分。乡村数字治理是现代数字技术与乡村公共治理结构相融合发展的综合体现,依靠数字技术构建一种多元主体、协同治理的乡村公共治理体系。就当前实际情况而言,研究者对乡村数字
学位
广东省,是岭南文化的重要发祥地之一,深厚的历史文化底蕴,充足丰富的山林资源与水资源,孕育出了淳朴友善、勤奋务实的广东人。广东人口密集,民族种类丰富,除了汉族之外,还大量分布了瑶族、壮族、畲族等少数民族。广东各个地区的歌谣,也就随着人们的日常生活逐渐产生了。广东歌谣历史悠久,种类丰富,蕴含着广东各地区的风土人情,承载着广东人民的劳动经验与生活智慧。但随着科技的发展与文化交流的冲击,人们逐渐将关注的重
学位