论文部分内容阅读
面向企业信息的机器翻译研究一直面临着特定领域标准语料不足,通用训练语料难以满足要求的尴尬局面。在专业训练语料不足的情况下,通过深入研究中文机构地址的构成特点,建立了用于机构地址切分的专用知识库,采用两级匹配模型进行切分,并以地址单元为单位将分词结果提交给基于规则的翻译系统,很好地保证了翻译单元的完整性。实验表明,针对中文机构地址翻译这个特定领域,提出的方法取得了比较令人满意的结果。