论文部分内容阅读
机器翻译是自然语言处理领域中的一个热点和难题,机器翻译的研究对国际间交流合作、学术上和商业上都具有十分重要的理论和实践意义。本文在调研了国内外机器翻译研究历史与现状的基础之上,分析了目前统计机器翻译的相关理论,实现了一个统计机器翻译系统,并将其应用于航空领域标题的翻译,取得较好的翻译效果。 本文的创新点在于整合了国际上一些公开的工具,改进了翻译模型模块,搭建了一个基于短语的统计机器翻译系统。从语料的预处理,模型参数的训练,翻译过程的执行,到最后翻译结果的自动评测,实现了一个完整的翻译流程。 主要的工作包括以下几个方面: 第一,语料的预处理。语料的加工程度直接影响翻译结果。统计机器翻译通常都采用双语语料,本文分别对中英文两种语言的语料进行了预处理。 第二,在对统计机器翻译的相关理论进行了研究的基础之上,利用一些现有的资源和工具,补充了短语翻译模型模块,实现了一个基于短语的统计机器翻译系统。并介绍了系统工作的基本原理,系统实现,系统运行环境和参数设置。 第三,将系统应用于航空领域标题的翻译。结合航空领域标题的特点,进行有针对性的翻译,取得了较好的翻译效果。 第四,机器翻译自动评测技术的研究。本文在研究自动评测技术的基础上,将航空领域标题翻译的结果进行了自动评测。 本文的研究和实验证实了基于短语的统计机器翻译方法的有效性。目前,也有人在探索基于语言深层结构的翻译模型,这已成为一个新的研究点,相信在这方面,统计机器翻译还有较大的改进空间,这也是下一步研究的重点。