一种日语动词格框架自动构造策略

来源 :南京大学 | 被引量 : 0次 | 上传用户:alx0890
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器翻译技术已有60多年的发展历史。60多年里,各种翻译方法和商业机器翻译系统不断涌现。随着信息的急剧增加、国际交流的日趋频繁以及计算机网络的迅速发展、普及,人们对机器翻译的研究越来越重视。机器翻译已成为信息社会学术研究的热点。 语义分析是机器翻译中的一个难点问题,而格语法和语义角色标注是语义分析的代表性方法。基于格语法的语义角色标注,离不开动词格框架的支持,一个动词的格框架描述了可与之相匹配的格短语的类型。 本文结合一个具体的日汉机器翻译系统,介绍基于格语法的日语分析策略,并指出格框架词典在日语分析中所具有的重要作用。目前该日汉翻译系统所采用的日语动词格框架词典规模很小,导致格角色标注不准确,从而影响了翻译质量。针对该问题,本文提出一种自动构造日语动词格框架词典的方法,用以扩大动词格框架词典。该方法基于Fillmore提出的格语法体系,根据日语语法的特点,利用在原基于规则库分析策略基础上改进的分析策略,从生语料中抽取出格框架实例,并根据一套语法约束规则对抽取结果进行过滤;然后将过滤后的格框架实例与翻译系统原有的格框架词典进行类比,以得到格框架中缺失的深层格信息,最终构造出翻译系统能够使用的动词格框架词典。 格框架词典在翻译系统中有两个作用,一个是解决格短语绑定问题,另一个是设置格短语的深层格信息(格角色标注),进而影响翻译结果中译词的选择与添加。本文从后者的角度对自动构造出的格框架词典进行了评测,评测试验显示自动构造出的格框架词典能够修正许多因为深层格设置错误引起的翻译误差和错误。
其他文献
传统工作流管理系统把一个项目的各个操作环节组织在一起进行管理,提高了企业的运作效率,它有流程相对固定、任务的操作者相对固定的特点。进入二十一世纪,随着工作流技术的深入
本论文着重探讨了基于移动Agent的机场信息管理系统安全问题。从分析移动Agent技术及其安全问题入手,本文在论述了移动Agent系统所面临的各种安全性问题之后,详细介绍了现有的
学位
大数据分析是大数据应用的主要方向,传统的RDBMS的由于扩展性差,大数据下IO压力大,数据分析效率低下等问题,已经很难适应海量数据管理的需求。将HBase应用到业务系统做大数据分析
云存储系统作为快速存储大数据的一种方式,也是大数据的主要存储平台,其能耗问题已经成为当前大数据应用当中亟待解决的重要问题。云存储系统中数据块副本放置策略,磁盘状态,CPU
随着网络技术的飞速发展,当前通信网络带宽和处理能力的提高使网络能够提供更多的多媒体业务,也使得支持“点到多点”或“多点到多点”的组播通信方式成为网络支持多媒体业务的
学位
对用户需求的持续响应要求软件开发迭代周期不断缩短,促使在线应用系统的开发模式向持续交付转变。新的开发模式使得系统性能保障面临更大挑战。系统升级上线后出现服务失效、
对象管理组织OMG(Obiect Management Group)提出的模型驱动架构MDA(ModelDriven Architecture)是解决不同中间件平台之间的集成以及技术升级所引起的问题的软件开发方法。MDA
近几年来,虚拟现实技术的应用与研究得到迅速的发展,它是一门涉及计算机图形学、人工智能、多媒体技术以及人机接口技术等诸多领域的新兴技术,在许多领域具有广泛的应用前景,日渐
介绍了图像欠量化方法的研究背景、研究意义及国内外研究现状。以图像矢量化过程中的预处理技术为基础,并根据矢量化对象的不同,将图像矢量化方法分为简单色调图矢量化及复杂色
随着Peer-to-Peer(P2P)技术的不断发展,其影响越来越大,应用范围越来越广。P2P系统的开放性和自治性,使得P2P系统的安全性成为一个具有挑战性的课题。其中一个重要的安全问题就
学位