论文部分内容阅读
相似句子的匹配与查找是翻译记忆中的关键技术,其中语义的表达和理解占据着非常重要的作用。本文将语义网中的本体技术引入到翻译记忆系统中,来提高机器翻译的语义处理能力。
论文介绍了机器翻译的研究发展现状和现有的技术方法,分析了翻译技术中存在的问题,同时对本体工程理论进行了研究,探讨了本体在机器翻译技术中的优势,提出了将本体引入到翻译记忆系统中的思想。
结合本体构建原则、方法和现有Wordnet结构,研究了面向机器翻译领域本体的构造方法。以计算机文献领域的专业术语为范围构建了一个知识本体CSO。为相似语句的查找提供了一个语义空间。
对机器测评中句子间的模糊匹配算法进行了研究,将其应用于翻译记忆中的句子匹配中,对算法中存在的不足进行了分析。将本体中的概念相似度算法引入到模糊匹配算法中,通过对现有模糊匹配算法的改进,从语义上提高了系统检索相似语句的能力。
对基于本体的模糊匹配算法进行了实验测试,验证了算法的可行性。实验表明,通过引入本体,能够较全面地搜索到一些被忽略的、语义相近的模糊词对,句子的相似度也得到了一定的提高,从而提高了系统的匹配成功率。