论文部分内容阅读
随着经济全球化的不断发展,跨语言交流的需求不断增长,使用机器翻译实现自然语言的自动翻译有很大的需求。近年来机器翻译技术不断进步,能够满足基本的翻译的需求,但是用户对翻译质量的要求不断提高,系统融合技术作为有效的提升机器翻译质量的方法在评测和实践中被广泛使用。围绕着系统融合技术,本文的研究主要涉及以下几个方面:(1)对系统融合性能的影响因素进行了分析。使用系统融合的远景得分作为评价指标,对参与融合的系统个数和融合候选来源对系统融合性能的影响进行分析。研究参与融合的系统数量对系统融合远景得分的影响时,本文给出在不同个数的系统参与融合的情况下所对应的系统融合远景得分。研究融合候选的来源对系统融合性能的影响时,给出在融合候选来自多个源语言和单个源语言的情况下,系统融合远景得分随系统个数变化的曲线,给出多源和单源远景得分变化曲线的对比。最后分析实际的融合方法对系统融合性能的影响,比较了句子级别和词汇级别系统融合方法在特定数据上的融合结果,实验结果表明词汇级别融合方法优于句子级别融合方法。(2)研究了基于机器学习的融合候选排序问题。参与系统融合的多个系统之间存在较大的翻译质量差别,使用全部的融合候选参与系统融合所获得的融合结果并不是最优的,需要从众多的融合候选中选择翻译质量较高的融合候选。本文使用基于pair-wise的排序方法实现融合候选质量排序,这种方法将列表排序问题分解成大量的二分类问题,从而可以尝试多种现有的分类算法。在使用融合候选排序的系统融合方法中,首先需要从训练集中训练统计排序模型,接着将统计模型应用到测试集中每个句子并产生融合候选排序结果,然后使用排名较高的融合候选参与后续的系统融合。本文将融合候选排序应用到句子级别和词汇级别系统融合方法中,根据实验结果可以发现,使用融合候选排序并使用高质量的融合候选参与融合对句子级别和词汇级别融合方法有显著的性能提升。(3)向现有的系统融合解码使用的对数线性模型中添加局部特征。系统融合解码时使用对数线性模型给搜索解码空间,现有的对数线性模型中包括语言模型得分、句子长度、ngram-count以及词置信度四个常用的特征。语言模型得分是用从通用语料训练出的语言模型对解码结果进行打分,用于衡量融合结果的流利度。句子长度用于控制解码结果在合理的限度内。Ngram-count作为局部信息,对系统融合性能提升有着显著的作用,因此本文尝试加入更多的局部特征以提升系统融合的性能。本文尝试在对数线性模型中加入新的局部特征,包括局部语言模型得分、skip-gram匹配个数和词后验概率三个特征。本文给出在现有特征的基础上分别添加三个特征后对应的融合结果得分,并据此分析每一个特征的有效性。同时我们也给出了不同特征之间的组合对系统融合性能的影响。对于系统融合,本文首先对系统融合性能影响因素进行实证分析,然后通过挑选高质量的部分融合候选提升系统融合的性能。最后给出局部特征对系统融合性能的影响。