论文部分内容阅读
在经济全球化的背景下,随着互联网技术的迅速发展,各个行业的国际交流日益频繁,跨语言交流的需求愈发明显。机器翻译作为一种高效工具,能够在保留原始语义的前提下实现不同语言间的等价转换,具有很大的实用意义。近年来深度学习技术迅速发展,不仅仅在语音识别、图像处理领域,自然语言处理领域的相关研究也取得了不错成果,本文针对基于深度神经网络的中英机器翻译模型进行研究。本文采用端到端的编码器-解码器框架构建神经机器翻译模型,让机器自动地进行特征学习,将语料数据采用分布式表示的方式转化为词向量,使用神经网络实现源语言和目标语言之间的直接映射。针对不同神经网络结构构建神经机器翻译模型进行研究。首先利用三种神经网络结构构建神经机器翻译模型,RNN网络结构能够处理不定长序列的特点构建神经机器翻译模型,但存在梯度爆炸和梯度消失的情况。基于LSTM网络的翻译模型,通过门阀机制缓解了梯度衰减,提升了处理长距离序列的能力,基于GRU网路结构在其基础上进行了简化处理,降低训练复杂度的同时也取得了不错的性能。针对编码器部分任意长度源语言序列均被编码成固定维度背景向量的问题,引入注意力机制动态调整源语言端上下文对目标语言序列的影响程度,提升翻译模型处理长距离依赖的能力。为更好地体现上下文信息,本文进一步提出基于双向GRU的机器翻译模型,针对多种翻译模型进行对比分析,验证模型性能提升的有效性。针对神经机器翻译不能很好地利用语言学知识的问题,提出加入词性序列信息的神经机器翻译模型,在融合注意力机制的双向GRU的翻译模型的基础上,采用Stanford Parser进行句法分析获取词性序列信息后,以双向编码的形式将其融入翻译模型的编码器部分,采用向量拼接的方式共同构成背景向量。实验表明,词性序列信息的加入能够提高翻译模型性能。