基于深度神经网络的中英机器翻译模型研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:xxglov
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在经济全球化的背景下,随着互联网技术的迅速发展,各个行业的国际交流日益频繁,跨语言交流的需求愈发明显。机器翻译作为一种高效工具,能够在保留原始语义的前提下实现不同语言间的等价转换,具有很大的实用意义。近年来深度学习技术迅速发展,不仅仅在语音识别、图像处理领域,自然语言处理领域的相关研究也取得了不错成果,本文针对基于深度神经网络的中英机器翻译模型进行研究。本文采用端到端的编码器-解码器框架构建神经机器翻译模型,让机器自动地进行特征学习,将语料数据采用分布式表示的方式转化为词向量,使用神经网络实现源语言和目标语言之间的直接映射。针对不同神经网络结构构建神经机器翻译模型进行研究。首先利用三种神经网络结构构建神经机器翻译模型,RNN网络结构能够处理不定长序列的特点构建神经机器翻译模型,但存在梯度爆炸和梯度消失的情况。基于LSTM网络的翻译模型,通过门阀机制缓解了梯度衰减,提升了处理长距离序列的能力,基于GRU网路结构在其基础上进行了简化处理,降低训练复杂度的同时也取得了不错的性能。针对编码器部分任意长度源语言序列均被编码成固定维度背景向量的问题,引入注意力机制动态调整源语言端上下文对目标语言序列的影响程度,提升翻译模型处理长距离依赖的能力。为更好地体现上下文信息,本文进一步提出基于双向GRU的机器翻译模型,针对多种翻译模型进行对比分析,验证模型性能提升的有效性。针对神经机器翻译不能很好地利用语言学知识的问题,提出加入词性序列信息的神经机器翻译模型,在融合注意力机制的双向GRU的翻译模型的基础上,采用Stanford Parser进行句法分析获取词性序列信息后,以双向编码的形式将其融入翻译模型的编码器部分,采用向量拼接的方式共同构成背景向量。实验表明,词性序列信息的加入能够提高翻译模型性能。
其他文献
今年6月3日,国家发展改革委印发了《关于加快开展县城城镇化补短板强弱项工作的通知》,要求各地区统筹配置城镇化补短板强弱项工作的公共资源,重点投向县城新型城镇化建设,并
无敌花海、中药主题乐园、五星级酒店……这样的高配正造就位于珠海市斗门区的岭南大地田园综合体。9月初秋来临,天气虽已渐凉爽,但岭南大地工地上的建设却仍然热火朝天。记
班得瑞,一个伟大的音乐团体,自然音符的发掘者,全人类的心灵捕手。他们将自然界最美的音符收集起来,制作成一块块奇石珍宝,献给人们。班得瑞的自然音乐,比起那些朗朗上口的流行歌曲
面对知识经济,高职教育必须高度重视并切实抓好创新教育工作,深化课程改革,把培养高素质的技术型、创新型人才放到突出位置。构建高职人才培养模式,不应全盘否认过去的做法和
专业设置的盲目性和学校布局的无序是造成目前职校毕业生就业困难的重要原因。但职校生在某个时期、某些专业的不充分就业,有利于职教由粗放型向集约型转变;当前,要特别提倡"
我国正处于建立国家公园体制的起步阶段,社区参与制度作为国家公园管理体系的组成部分,是为国家公园内的地方社区寻求经济社会福利的重要保障。本文拟在评述近年来国内对国家
按照“统一规划,集中管理,动态开发,资源共享”的指导思想,在《城市地下管线工程档案管理办法》(建设部令第136号)的基础上,结合本市实际,宿迁市政府办公室出台了《宿迁市城市地下管
写作能力是人的认识能力、思考能力和文字应用能力的综合反映。本文用错误分析的相关理论,对宿迁学院2010级非英语专业A班、B班(两班分别为52人)的学生英语写作过程中常犯的错误
翻译是最普通的概念,但却是最不清楚的概念。到目前为止,翻译界对翻译本质问题仍没有一个令人满意的答案,翻译本质仍处于被遮蔽之中。文章首先分析了翻译本质认识的误区,指出