英汉机器翻译评价研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hytsxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文的研究内容包括四个主要方面:一是在总结现有评价方法的基础上,探讨一些主流评价方法在英汉机器翻译评价中是否适用,分析这些方法的优缺点,为进一步的研究开发打下基础;二是探索适用于我们的应用背景的英汉机器翻译评价方法,并在测试集开发、结果分析等方面改进这些方法;三是探讨翻译评价方法的性能分析体系,为评价方法的研究、开发和应用奠定理论基础;四是探索自动评价方法在自然语言处理领域,如机器翻译系统开发等方面的应用,深入研究评价方法的进一步应用.该文的目标是建立一套完整的、实用化的英汉翻译评价工具和评价理论体系,为机器翻译系统的开发和研究提供支持;其次,对机器翻译评价方法的应用进行初步尝试,为进一步深入的应用提供坚实的基础.简单易行、性能可靠的机器翻译评价方法是该文的探索核心.该文从英汉机器翻译系统的评价着手,在机器翻译评价领域进行了比较全面的研究和实验.着眼于自动化、低成本的机器翻译评价策略,该文在以下四个方面进行了研究:1)研究了一些已有的评价方法,并对其在英汉机器翻译评价中的应用进行了研究.以现有的机器翻译评价方法为基础,该文研究了一些主流方法在英汉翻译评价应用中的可行性,针对汉语语言的特殊性对一些方法进行了改造.文章把各种评价方法所获得的系统评分规则化,进而对不同类型评价获得的结果进行了比较.2)提出了基于句子相似度的自动评价方法.为克服现有机器翻译评价方法存在的对评价人依赖性强、领域移植性差、测试集构造工作量大等缺点,该文提出了基于句子相似度的自动评价方法.该方法采用编辑距离等测度作为句子相似度的评价标准,显示出较好的译文质量评价能力.3)参照教育测量的理论,提出了机器翻译评价方法和测试集合的性能描述框架.该框架包含反映评价方法可靠性的信度和效度,反映评价分辨能力的区分度,以及反映测试集合难易程度的难度系数等.该文对部分性能特征进行了实验测试,表明该体系具有较强的可操作性.4)对翻译评价方法的完善和实际应用提出一些方案.该文提出利用双向机器翻译服务于翻译评价,并探讨利用已有的译文评分对新译文的评分进行预测,从而重复利用句子评价的结果、降低人工建设测试集的成本.为了进一步深化评价方法的研究,该文提出译文评价结果的可视化、利用自动评价结果预测人工评分、以及利用自动评价改造机器翻译系统等方法,进一步验证了自动化机器翻译评价方法的实用性.
其他文献
随着P2P技术的迅猛发展、需求与应用的不断拓展、用户数量的急剧增加以及交互方式的日化,P2P系统开始具有高度动态性和复杂性特征,是一个典型的复杂网络,其网络拓扑己被证实
随着计算机技术的飞速发展,尤其是网络技术的发展,出现了很多复杂的分布式应用系统。为了简化异构环境下分布式应用的集成和互操作,自上世纪90年代开始,工业界先出现了许多功能强
对当今社会的各行各业来说,数据仓库与信息分析已经不再是个新鲜的概念了,有越来越多的企业将数据仓库与信息分析作为自己快速发展的利器。而信息分析系统是由一系列具有强相关
射频识别技术( Radio Frequency Identification,RFID)是一项具有广泛应用前景的自动识别技术。它利用射频方式进行非接触双向通信、交换数据从而达到识别目的。本文研制支持
本文结合机器人足球比赛,对群机器人系统协作问题进行了深入和系统的研究,提出了一些新的思想和方法.受自然水流动特性的启发,本文提出了一种群机器人在动态环境下进行路径规
本文针对手语识别中的四个问题:非特定人、大词汇量、连续手语、如何利用语言模型来提高手语识别率,分别建立合适的模型来解决这些问题:1.针对非特定人手语识别的特点:1)数据
随着计算机技术、网络通信技术的发展,大量各种各样医院临床专业信息系统涌入市场,由于国内信息交换标准化程度比较低,各子系统之间缺乏统一的接口标准,因而在医院临床信息系
  本文实现了层次式交换网络的服务质量控制模型。通过充分利用层次式交换网络拓扑结构与地址结构的匹配所带来的优势,结合区分服务模型的基本思想,层次式交换网络的服务质量
和传统工业一样,软件企业进行软件生产的最终目的就是使用最少的人员成本、有效生产出高质量的软件产品。然而,软件过程却不像工业生产那样容易管理和控制。自从软件工程的概念
H.264/AVC是国际上最新的视频编解码标准,是未来几年内视频编码技术研究的主要方向。本文基于H.264/AVC视频编码标准对帧内预测和熵编码算法进行了研究,并采用SIMD技术对解码器