论文部分内容阅读
提出了一种利用双语语料库自动抽取多词翻译等价对的方法.首先利用N-gram模型获得候选翻译单元,然后根据统计同现计算候选等价对的翻译概率,并用贪心策略实现翻译等价对的自动抽取.在翻译概率的计算中对3种常用的统计同现测度进行了比较.实验表明,当语料规模较小时,对数似然比(Log Likelihood Ratio)测度对于翻译等价对的抽取具有较好的效果.与现有方法相比,该方法较好地解决了翻译等价对抽取中多词单元对应及间接相关问题.