异构化TensorFlow架构的研究与实现

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:qq120110023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球科技变革的推进,人工智能成为各大公司的研究热点和战略重心。TensorFlow是谷歌推出的开源机器学习框架,自开源以来便受到极大关注,是GitHub社区上最受欢迎的机器学习、深度学习项目之一。目前,TensorFlow可以在多个云平台上部署运行,但仍存在软件的依赖与管理问题,而利用Docker技术具有的快速部署与可移植等优势,通过Docker容器实现TensorFlow的虚拟化异构,可以解决TensorFlow环境依赖的问题,并为科研人员及工程师提供便捷的开发环境,具有现实的应用意义。本文通过TensorFlow与市场上其他主流深度学习框架的对比分析,针对TensorFlow在任务调度、容错等方面存在的不足,提出相应的改进优化方案;利用Docker技术拥有的资源隔离、高性能及可移植等优点,使用Docker容器部署TensorFlow,实现TensorFlow的虚拟化异构;通过构建基于Docker集群的TensorFlow深度学习系统,实现TensorFlow深度学习系统的分布式部署,提升平台数据吞吐量;并通过多GPU并行化模型训练方案,解决深度学习训练时间长的问题。本文实现了以下内容:(1)TensorFlow架构的研究与改进:对目前市场上主流的深度学习框架在不同维度上进行比较分析,进一步分析了深度学习平台TensorFlow在任务调度、容错和性能监控等方面存在的不足,并针对这些问题提出对应的优化改进方案;(2)设计Docker容器集群:通过使用Open vSwitch+GRE隧道技术实现跨主机容器间的网络通信,在此基础上构建Docker容器集群,为后续实验提供基础条件;(3)实现Docker容器集群的负载均衡:通过获取节点主机和容器的实时性能监控数据,设计与实现整个容器集群的弹性伸缩流程,根据用户设定的相关资源阈值上下限触发弹性伸缩机制,同时采用基于资源使用量的调度策略选择应用容器扩展或销毁的节点,从而提高了集群的资源调度效率和利用率;(4)数据并行训练方案设计与实现:针对原有数据并行方案通过同步或异步的方式进行模型更新操作的主从式结构并行效率低的问题,本文设计了一种环形并行结构,相比主从式结构具有更高的GPU使用效率;(5)通过对异构化TensorFlow设计测试实验并进行实验结果对比分析,证明异构化TensorFlow能有效提高计算资源利用效率,缩短深度学习训练时间,具有重要的实际应用价值。
其他文献
目的分析Angelman综合征(AS)的临床及脑电图(EEG)特征,提高临床对本病早期而准确的认识。方法分析2006年1月至2009年11月北京大学第一医院儿科神经门诊、病房及EEG监测室8例
虚拟组织是网格协同解决问题的高效资源组织形式。按需、动态、即时构建虚拟组织适应了网格应用的多样性和网格资源的动态性。但目前支持动态构建虚拟组织的声誉机制、保障其
目的探讨临床药师开展药学监护模式,为患者提供安全有效的药学服务。方法临床药师参与临床用药方案的制定和评估,重点关注治疗过程中药物选择、药物间相互作用及可能出现的药
<正> 补体参与免疫反应目前已知通过下述三条途径被激活:1.补体傅统激活径路;2.补体替代激活径路;3.C3b 正反馈径路(或称效应扩大支路)。这三种不同的补体激活径路都要通过 C3
心力衰竭是各种心血管疾病的严重和终末阶段,致残致死性高,严重威胁人类的健康。据估计,中国目前拥有超过1 000万的心衰病人。尽管近20年来慢性收缩性心力衰竭一直使用血管紧
近年来,电网工程的投资规模和水平不断提升,如何精准投资成为电网工程投资控制研究发展中一个亟须解决的关键问题。基于此,引入全生命周期理论,在结合电网工程特性、国家建设
文中在总结运营公路隧道的荷载特点、概括影响隧道荷载效应各种因素及其统计特征的基础之上,运用蒙特卡罗有限元法对厦门海底隧道海域Ⅳ类围岩下左洞某断面二次衬砌的荷载效应
目的观察呼吸科与ICU侵袭性肺部真菌感染患者的临床情况。方法随机抽取我院收治的侵袭性肺部真菌感染患者110例,根据科室不同分为2组,其中55例呼吸科患者作为A组,55例ICU患者
对非分散红外SO2气体检测技术及其运行机理作了系统介绍。分析了非分散红外SO2气体检测的吸光度获取方案及浓度反演方法。以三阶多项式为拟合模型,采用非线性最小二乘法获得
目的了解超声耦合剂是否对患者术前皮肤消毒用的含碘消毒剂产生屏蔽或拮抗作用。方法采用实验室载体浸泡杀灭、现场皮肤消毒等比对试验,对碘伏和超声耦合剂的拮抗、屏蔽作用