论文部分内容阅读
机器翻译技术已有60多年的发展历史。60多年里,各种翻译方法和商业机器翻译系统不断涌现。随着信息的急剧增加、国际交流的日趋频繁以及计算机网络的迅速发展、普及,人们对机器翻译的研究越来越重视。机器翻译已成为信息社会学术研究的热点。
语义分析是机器翻译中的一个难点问题,而格语法和语义角色标注是语义分析的代表性方法。基于格语法的语义角色标注,离不开动词格框架的支持,一个动词的格框架描述了可与之相匹配的格短语的类型。
本文结合一个具体的日汉机器翻译系统,介绍基于格语法的日语分析策略,并指出格框架词典在日语分析中所具有的重要作用。目前该日汉翻译系统所采用的日语动词格框架词典规模很小,导致格角色标注不准确,从而影响了翻译质量。针对该问题,本文提出一种自动构造日语动词格框架词典的方法,用以扩大动词格框架词典。该方法基于Fillmore提出的格语法体系,根据日语语法的特点,利用在原基于规则库分析策略基础上改进的分析策略,从生语料中抽取出格框架实例,并根据一套语法约束规则对抽取结果进行过滤;然后将过滤后的格框架实例与翻译系统原有的格框架词典进行类比,以得到格框架中缺失的深层格信息,最终构造出翻译系统能够使用的动词格框架词典。
格框架词典在翻译系统中有两个作用,一个是解决格短语绑定问题,另一个是设置格短语的深层格信息(格角色标注),进而影响翻译结果中译词的选择与添加。本文从后者的角度对自动构造出的格框架词典进行了评测,评测试验显示自动构造出的格框架词典能够修正许多因为深层格设置错误引起的翻译误差和错误。