【摘 要】
:
深度神经网络等人工智能技术应用到了社会生活的各个领域,并取得了重大的进展,如语义分析、军事应用、图像识别、动作捕捉和语音识别等。然而训练深度神经网络模型需要花费大量时间,有些复杂深度神经网络模型在单个计算设备独立训练需要几天的时间,还有些神经网络模型在单个计算设备训练时会出现内存不够的情况。为了减少深度神经网络的训练时间,本文将重点关注深度神经网络训练加速技术的研究与实现,包括基于混合精度训练的并
论文部分内容阅读
深度神经网络等人工智能技术应用到了社会生活的各个领域,并取得了重大的进展,如语义分析、军事应用、图像识别、动作捕捉和语音识别等。然而训练深度神经网络模型需要花费大量时间,有些复杂深度神经网络模型在单个计算设备独立训练需要几天的时间,还有些神经网络模型在单个计算设备训练时会出现内存不够的情况。为了减少深度神经网络的训练时间,本文将重点关注深度神经网络训练加速技术的研究与实现,包括基于混合精度训练的并行优化器技术、基于异步并行的神经网络训练加速技术和深度神经网络训练加速系统的设计与实现三个方面。首先,针对深度神经网络训练的计算数据量大和内存冗余问题,提出了一种基于混合精度训练的并行优化器设计。研究了混合精度训练中精度转换以及优化器权重衰减的问题,设计了一种切分优化器参数的并行优化器,在数据处理方面采取混合精度的方法,基于参数切分实现了并行训练。通过初步实验对所提出的方法进行了评估,验证了该加速方法的有效性。然后,针对并行训练的负载不均衡、短板效应以及梯度延迟问题,提出了一种基于数据并行的异步并行训练方法。根据数据切分结果,各个计算设备独立进行计算,设计了相应的通信机制,完成信息传递以及实现权重更新。通过实验对所提出的方法进行了评估,验证了该方法的有效性。最后,基于前序研究的方法,设计并实现了深度神经网络训练加速系统,提供了模型选取、优化器选择、学习率等超参数调整等功能。在前端提供了训练加速应用模块,将模型以及参数信息保存为二进制文件,通过直接读取二进制文件来完成前后端功能的实现,能够为用户提供直观方便的深度神经网络训练加速。
其他文献
拉曼光谱技术凭借独特的样品分子指纹信息,以及具有非入侵性、高化学特异性及受水干扰小等优点,使其在癌症诊断、生物学研究和材料等方面有很大的应用前景。但是由于拉曼光谱信息复杂,使其在样品信息解释方面存在挑战,因此需要有效的数据分析方法来解释复杂的光谱数据。随着人工智能技术的发展,越来越多的机器学习算法被应用在拉曼光谱数据处理中,如用于分类建模的有监督学习算法和可用于拉曼成像的聚类分析、谱分解算法以及多
现有的图像检测模型都是对通用目标进行检测,针对复杂背景下的图像小目标检测还存在难以准确识别的问题,特别是远距离小目标聚集与轮廓边缘不清晰时,检测误差较大。小目标在图像中所占面积小、分辨率低,提取的特征很少,进而不容易被检测。合并多个尺度特征信息能够增强小目标的特征,目前针对特征多尺度处理方式通常是采用特征金字塔(Feature Pyramid Networks,FPN),但是在特征金字塔融合的过程
近年来,能源紧张和化石能源产生的环境污染问题急需解决,寻求可再生清洁能源成为材料、能源等学科的重点研究方向。利用传统试错法和密度泛函理论计算的方式寻找光伏材料的错误率高,消耗资源大且耗时久。本工作结合机器学习预测与第一性原理计算,成功预测出高效且稳定的潜在二维钙钛矿材料(Ba2VON3和Sr2VON3),并对材料的能带结构、稳定性、光学吸收谱以及理论最大光电转换效率进行模拟计算,同时研究了碳离子注
随着互联网社交论坛中在线内容的激增,立场检测作为情感分析的一个重要子问题,得到了越来越多的关注与应用。与此同时,针对立场检测的研究也面临了较多挑战,比如静态词嵌入技术对文本上下文语义理解不充分和模型速率较慢等问题。现有的立场检测模型往往只针对单一语言或单一来源的数据集展开研究,也很少有研究者考虑模型的训练及预测速率。为解决上述问题,本文提出了基于DBMPT的立场检测模型,实现了具有立场检测功能模块
大频差可调谐双频激光器在激光干涉测量、光生毫米波、激光雷达等领域有着巨大的应用潜力。常用的双频激光产生方法主要是利用塞曼效应、Sagnac效应、磁光效应、旋光效应和双折射效应等,将一个激光频率分裂以获得两个频率。基于塞曼效应的0.632μm双频He-Ne激光器,因受到Ne原子荧光线宽(1500 MHz)的限制,频率分裂量较小。相比而言,固体荧光线宽要远远大于气体的荧光线宽,通过引入双折射效应获得双
随着人工智能计算能力的日益增强与可获取数据量的日益提高,知识图谱和事件图谱成为计算机领域内相当成熟的一个应用。但由于现有知识图谱和事件图谱大部分由一种语言构成,而一种语言无法对整个世界的知识进行全面描绘。在大数据时代,不同语言的信息共享已成为世界发展趋势。跨语言图谱融合由于多语言间的一词多义、一义多词以及未登录词等问题,一直是一个很难找到最优解决方案的研究难点。跨语言事件图谱融合旨在找到不同语言事
在日常生活中保持社交距离有助于保护人们的生命财产安全不受侵害,尤其是在疫情时期,保持一定的社交距离是防止病毒传播的有效途径,然而个体并不习惯自己与其他人之间保持2米以上的距离。因此,能够探测行人间距并向他们发出警告的社交距离检测系统可以有效减缓致命疾病的传播。当前,国内外研究人员分别在行人检测、跟踪与距离估计等领域有深入研究,但针对以上领域的融合研究仍相对较少。本文提出了一个包括行人检测、行人追踪
据世界卫生组织(WHO)统计,每年全球大约有180万人直接或间接死于胃肠道类疾病,然而目前存在专业内镜分析医生较少,患者产生的内镜数据较多导致的医患矛盾问题。故考虑使用人工智能“AI”辅助消化道疾病识别,而基于人工智能的消化道辅助诊断技术面临数据量大,分类网络模型众多,数据隐私安全得不到保障导致的网络模型选择困难。因此,本文针对前述关键问题做出相关研究。本文针对深度学习在医学图像领域面临的:数据隐
被动锁模技术是目前获得超短脉冲输出的重要手段。基于被动锁模技术的超短脉冲激光器,其输出脉冲具有持续时间极短,与物质相互作用过程超快的特性,是各学科研究微观超快现象的理想工具,并且在生物医学、工业加工以及军事国防等领域发挥着不可替代的作用。超短脉冲掺镱光纤激光器不仅具有上述特点,而且汲取了三价镱离子和光纤的优点,成为了一种输出脉冲持续时间短、输出功率高、结构紧凑、散热优良、使用成本低的特殊激光器,拥
许多预防和治疗癌症的药物都以DNA为靶分子,研究抗癌药物与DNA分子之间的相互作用位点及作用过程,对阐述药物抗癌活性和毒性机理,寻找低毒性、高效率的抗癌药物,指导合理用药以及预防药物污染具有重要意义。阿霉素(Doxorubicin,DOX)是一种以DNA为靶分子的广谱蒽醌类抗癌药物,对乳腺癌、肺癌、多发性骨髓瘤等多种癌症的治疗效果显著。然而,由于DOX具有心脏毒性、胃肠道毒性、皮肤毒性等副作用,使