GPU平台上循环神经网络训练算法设计与优化

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:a419132258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技不断发展及理论基础日益成熟,深度神经网络(Deep Neural Net-work,DNN)目前已被广泛应用于众多领域,并且为各自领域带来突破性进展。在自然语言处理(Natural Language Processing,NLP)方向,相较于传统机器学习方法及概率模型,循环神经网络(Recurrent Neural Network,RNN)在训练时序序列方面取得极佳效果,并迅速应用于语音及自然语言理解等领域。同时,多核处理器及深度学习专用加速卡等高性能处理器的发展,进一步推进了基于神经网络模型的研究与应用。本文主要基于GPU平台,对如何提升循环神经网络模型的训练准确率及训练速度进行研究,并针对此两方面进行算法设计及优化,从而提升语音识别、机器翻译模型等实际应用训练效果。本文主要工作内容和成果包括:(1)针对语音识别应用及其模型,提升模型训练准确率及训练速度。通过对其训练数据进行重新组织,提升其模型训练速度;针对时序序列特征,改进数据规范化算法,减少数据漂移,达到均匀分布。在训练过程中,结合调整学习率、隐藏层神经元数量和参数更新算法等调参方法,最终在相同训练阶段内提升训练准确率。(2)针对机器翻译应用及其模型,提升模型训练速度。基于机器翻译预测模型,通过对模型进行并行算法优化,充分利用计算资源,将原单句训练变为多句训练,在保证翻译质量情况下,提升单句训练速度。(3)提升基于GPU循环神经网络模型训练速度。通过编写高效CUDA计算内核,提升计算效率;通过改善GPU显存重用率,增大单次训练样本数,充分利用计算资源,提升训练速度;基于GPU硬件计算单元,通过低比特量化方法对模型参数进行量化存储,减小参数存储规模,同时使用混合精度方法进行微调训练,从而对模型进行加速计算。本文通过对循环神经网络及相关应用模型结构的深入理解,结合深度学习框架,基于GPU平台,设计并实现了循环神经网络优化算法,同时充分利用硬件特性,有效提高了语音识别模型及机器翻译模型训练准确率及训练速度,为后续研究奠定基础。同时,本文所有工作已应用于科大讯飞实际应用中,向有效提升了模型准确率及训练速度,从而推动其应用开发进程。
其他文献
<正> 黄河,生命的河,历史的河,继往开来的河。黄河有时一泻千里、汹涌澎湃,但更多的时候是那样平静,那样深沉。有人把黄河比作中华民族的母亲,然而在作者的心里,它那浑厚的气
中小学班主任是班级工作的组织协调者、班集体建设的指导者和素质教育的重要实施者。班主任的责任和使命是建设一个蓬勃向上的班集体,促使全班学生德智体美全面和谐发展。班级管理是一个螺旋式的由初级向高级发展的过程,从班主任管理行为表现、班集体建设情况和学生学习成长三方面而言,要经历由“管”到“管住”再到“管好”的三个境界,即班级管理所达到的三个不同层次水平。    一、管的境界:勤于管理,热心治理秩序然  
一、政治与公民生活  政治生活是公民生活的重要组成部分,与公民的日常生活紧密相连。高中政治是对初中政治的进一步深化,重在培养学生的公民素养,对学生进行价值观引导,并为学生即将步入成年期做好思想准备。  高中政治课程标准中明确指出:高中政治要“坚持马克思主义基本常识教育与顺应时代发展要求相统一”“构建以生活为基础、以学科知识为支撑的课程模块”“强调课程实施的实践性和开放性”。这些理念是对高中政治以生
目的分析宫颈癌前病变患者的心理特点,探究个性化优质护理方式对患者护理前后身体功能变化所产生的作用和意义。方法选取2012年2月至2014年8月来医院接受检查和治疗的宫颈癌
随着中国经济不断融入全球化体系,我国企业将面临着十分严峻的国际竞争形势。建立现代企业信用管理制度显然成为企业长期发展的核心和基础。
“牺盟会”和“战动总会”都是中共抗日民族统一战线政策的产物 ,在其建立时虽曾先后得到阎锡山批准 ,但两者的性质和特点却不相同。牺盟会是以官办团体出现的地方性群众抗日
课改的主旨是培养学生的创新精神和实践能力,全面转变以教师为主体、学生以定势思维全盘接受的教学方式。也可以将之具体理解为我们要从质的层面上将教师由演员升格为导演,全
<正>"两张皮"是指相互之间原本存在必然联系或依附关系的两种事物发生游离而单独存在。我认为,目前教师的教育行为也广泛存在着"两张皮"的现象。主要体现在以下三个方面:一、
<正> 最近在浙江美术学院学报《新美术》一九八三年第四期上,发表了王肇民同志的《我的意见仍然是“形是一切”》的文章,他重申了过去在其《画语拾零》中的意见。据说此论发
适应建筑节能、墙材革新等政策的要求,提出一种新型保温承重结构体系——免拆保温墙模带缝剪力墙体系。运用有限元分析程序ANSYS对该体系剪力墙进行非线性分析。通过建立合理