论文部分内容阅读
本文使用语言学中的标志词假设来指导汉英翻译单元的抽耿,取得了较好的抽取效果。本文从以下三个角度对标志词在汉英EBMT中的应用进行了研究:1.在介绍了目前已经使用的英语标志词后,提出了汉语的标志词,并通过对一个较大文本的统计信息证明了这些标志词的分割句子相对独立单元的作用。2.在确定了汉语标志词的基础上,本文提出了三种基于标志词和词语对齐的汉英翻译单元抽取方法,经后来的实验验证,这些方法、尤其是第三种方法取得了较好的翻译单元抽取效果。3.提出了翻译单元的质量评价和系统集成评价相结合的评价策略。首先提出了翻译单元的质量评价原则和质量划分,并在此基础上对本文提出的翻译单元抽取方法的抽取结果进行了评价,证明了这些方法的有效性。而后在系统集成评价证明了这些翻译单元可提升翻译系统的性能。从而证实了标志词假设应用在翻译单元抽取中可取得较好的效果。