面向模型并行训练的模型拆分策略自动生成方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:zz123251234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着训练数据规模的增大以及训练模型的日趋复杂,深度神经网络的训练成本越来越高,对计算平台提出了更高的算力需求,模型训练并行化成为增强其应用时效性的迫切需求。近年来基于分布式训练的AI加速器(如FPGA、TPU、AI芯片等)层出不穷,为深度神经网络并行训练提供了硬件基础。为了充分利用各种硬件资源,研究人员需要在集合了多种不同算力、不同硬件架构AI加速器的计算平台上进行神经网络的模型并行训练,因此,如何高效利用各种AI加速器计算资源,并实现训练任务在多种加速器上的负载均衡,一直是研究人员关心的热点问题。提出了
其他文献
目的探讨循证护理在小儿全麻术后早期少量饮水的应用及效果。方法对49例全麻术后早期饮水的患儿采用循证护理模式,即提出临床问题、检索相关文件、对检索结果进行分析、选出
前方车辆测距在自动驾驶汽车技术领域中起着至关重要的作用。针对目前基于单目视觉的车辆测距技术忽略了车辆与地面相接的下边沿问题,提出一种基于车辆下边沿估计和逆透视变换的单目视觉测距方法,实现了对前方车辆进行横向和纵向的高精度车距测量。该方法首先通过对车辆关键点估计和几何关系模型完成对车辆下边沿的估计,然后从中计算测距关键点,再利用基于点的逆透视变换测距模型进行距离计算。实验结果表明,与其他基于单目视觉
锤击贯入式钢管桩的疲劳设计是TLP钢桩设计的一项重要内容。本文对TLP钢管桩在施工阶段的打桩疲劳和在位阶段的在位疲劳设计进行了探讨分析,提出了一种推荐作法,可供相关项目借
以一座标准跨径为30m的三跨一联连续梁桥的设计为依托,借助MIDAS/Civil软件建立相应的模型帮助分析,对采用预制节段梁和预制整体梁的两种设计方案进行比较,分别对该两种方案
图像压缩是数据传输和存储中必不可少的过程,分形图像压缩方法因其压缩方法简单、可任意尺度下重构、解码速度快且压缩比高具有独特优势,但传统分形图像压缩方法存在编码时间
海底管线用于将海底油气资源输送至陆地处理终端或销售终端,其铺设过程中的质量控制直接影响整个海上油田的安全长久运行,管线焊接质量更是关键。本文结合我公司印尼项目的海底
<正>1993年,我担任副主编的《上海文史》发表了谈瀛先生的《郁达夫家信沉浮》一文。4月8日傍晚,我带着那期《上海文史》拜访王映霞,她虽说此前并没有看过谈文,不过,旧事重提,
目前CRH 6A-200城际动车组已在珠三角地区批量运行,该车辆采用ATO自动驾驶技术,并由ATO控制进行精确停车。据了解,CRH 6A-200城际动车组在珠三角地区运行采用了不同的信号进
环境监察执法垂改对省级环保督察体系的建立完善具有积极影响,只有打造运行有序、顺畅高效的环境监察体制,才能为开展省级环保督察提供可靠的机制保证。$$环保督察机制和省以下
报纸
目前的图像垃圾邮件过滤技术,大都采用国际上通用的垃圾图像数据集作为训练集,与中国国内图像垃圾邮件的图像特点不一致,图像数据缺乏实时更新,且分类器单一,过滤效果难以保证。针对该问题,在建立国内垃圾邮件图像数据库的基础上,首先提取图像的颜色、纹理和形状特征,再经K-NN分类算法优选出HSV颜色直方图特征对不同分类器进行训练、测试和性能比较,提出将基于粗糙集的K-NN算法、Naive Bayes算法和S