论文部分内容阅读
翻译记忆是国内外专业领域计算机辅助翻译市场中使用最为广泛、有效的技术。记忆数据筛选(模糊匹配或语句相似度评价)决定了翻译记忆系统的有效性,这篇文章主要就其核心方法进行研究,介绍了使用编辑距离、向量余弦和Jaccard系数进行文本相似度评价的方法,使用基于《知网》和《同义词词林》的本体论、基于统计以及语法驱动的语义相似度评价方法,以及四种改进的评价方法,最后通过实验数据对其中四种典型方法进行比较分析,表明融合多目标评价可以提高数据筛选结果的实际有效性。