训练语料选取相关论文
双语训练语料作为统计机器翻译系统的不可或缺的知识来源,直接影响系统的翻译性能。一般情况下,训练语料的增加可以使系统翻译性能......
该文研究的目的是在待翻译文本未知的情况下,从已有的大规模平行语料中选取一个高质量的子集作为统计机器翻译系统的训练语料,以降......
统计机器翻译往往存在待翻译文本来源多样和领域不一致的问题。为了提升面向不同领域的文本的翻译质量,需要根据待翻译文本对训练......
统计机器翻译的训练数据通常来源复杂,主题多样,文体不一,与待翻译目标文本的领域不能保证完全一致,导致领域自适应问题。目前统计机器......