基于N元共现的机器翻译自动评价的研究

来源 :北京工商大学 | 被引量 : 0次 | 上传用户：whiterain

【摘要】

：

机器翻译评价与机器翻译是相辅相成的，机器翻译的发展决定了机译评价的进展，反之机译评价又促进机器翻译的发展。然而由于译文质量的人工评价价格不菲，评价过程非常耗时而且不可

【作者】

：

吕婷婷

【机构】

：

北京工商大学

【出处】

：

北京工商大学

【发表日期】

：

2007年期

【关键词】

：

机器翻译自动评价 n元共现 BLEU RBLEU

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器翻译评价与机器翻译是相辅相成的，机器翻译的发展决定了机译评价的进展，反之机译评价又促进机器翻译的发展。然而由于译文质量的人工评价价格不菲，评价过程非常耗时而且不可重用，因此人工机器翻译评价一直很难对机器翻译系统开发提供切实的帮助。找出一种有效、可行的机器翻译自动评价方法将对机器翻译的发展产生极大的推动作用。本课题的研究目的就在于探索、实现机器翻译译文质量的自动评价，论文首先阐述了机译自动评价的概念原理，介绍分析了几种现有的评价方法，在此基础上提出新的自动评价方法RBLEU，希望通过本项目的研究，能够对机器翻译自动评价的深入发展起到积极的作用。本文提出了一种新的评价方法RBLEU，采用了基于n元共现的思想并使用了调和平均数作为评价的主要指标。系统实现了BLEU和新方法RBLEU两种评价标准，针对三个商用机器翻译系统的译文质量进行了客观的自动评价。论文对实验结果进行了比较和分析，证明了该方法能够在译文质量方面对机器翻译系统做出比较客观的评价。本实验中的20句汉语源文是从1998年863汉英机器翻译测试题库中抽样取得的。其参考译文分别是由英语水平优秀、良好和一般的，母语为汉语的大学生提供，存放在Access数据库中。应用程序采用了面向对象的思想设计和开发，使用了Java语言技术，利用了开放的集成开发环境Eclipse作为工具平台，使用了JFC实现应用程序的用户界面，使用JDBC实现了程序和Access数据库的通信。

其他文献

P2P网络搜索方法的研究及在远程考试系统中的应用

目前，在Internet上广泛采用以集中数据存储和网络管理为核心的C／S模式，日益面临着资源的访问延迟、通信错误、服务器过载以及负载不平衡等一系列问题，严重引起了网络局部负荷过大

学位

P2P网络资源搜索JXTA协议远程考试

心血管的三维分割与模拟投影

心血管疾病已经成为世界范围内威胁人类健康的头号杀手。影像科医师则需要借助一些成像工具对这些成像图像进行观察，对一些疑似病灶，如硬化或者狭窄进行判断和确认。虽然目前心

学位

冠状动脉三维分割模拟投影多层螺旋CTX射线冠状动脉造影中轴约束

泛珠三角合作信息网一期工程的分析和设计

为加强泛珠三角区域合作信息交流，建立统一、快捷、方便的信息交流平台，根据“9+2”政府的共同意愿，由“9+2”日常工作办公室共同主办，南方新闻网承办，建立本区域枢纽式和门户式泛

学位

合作分析和设计信息发布

Web教学资源抽取技术及其应用研究

自上个世纪90年代末到至尽,Internet的得到了飞速发展,网络已经成为人们获取信息的主要来源。如何使人们从成千上万的网站中快速方便的获取自己想要的资源和信息已经成为当前

学位

信息抽取XML教学资源元数据抽取规则

标记分布学习及其应用

尽管多标记学习能够解决很多带有标记歧义性的问题，但是它却不能被很好地应用在不同相关标记相对于示例的重要程度不同的应用场景中。在本文中，我们提出了一种名为标记分布学习

学位

机器学习描述度标记分布学习算法评价标准

QoS驱动服务合成流程建模、分析及优化——基于扩展的分层着色Petri网

本文对QoS驱动服务合成流程建模、分析及优化进行了研究。文章通过QSC-nets，QoS驱动的特性、服务资源在运行时的动态变化以及服务执行的不确定性，在服务合成模型中都得到显式的

学位

计算机网络网络服务服务合成

非结构化文本中领域术语获取方法的研究

随着领域新技术的飞速发展，大量数字化科技文献都以非结构化文本的形式与日俱增，如何有效地获取其中的领域术语，对于构建数字图书馆、领域本体、编撰领域词典等都具有重要的现实

学位

领域术语统计学习信息抽取序列数据标注Reranking

智能化小区公共信息服务系统的研究与应用

随着21世纪科技的不断发展，人类已经逐步跨入了信息时代。特别是计算机及其网络技术进入建筑领域，给人类的居住方式带来了一场革命。生活在一个安全，舒适，信息传递快捷的居住环境

学位

J2EE智能化小区MVCStrutsJDBC

基于复合神经网络的掌纹识别方法的研究

当今社会,随着信息化与网络化的高度发展,信息安全显示出前所未有的重要性。因此,作为其中一个分支的身份识别技术也就具有相当高的研究价值与广泛的应用前景。其中,生物特征

学位

生物认证掌纹识别Zernike矩复合神经网络

秘密共享方案的研究

秘密共享是在一组参与者(或成员)中共享秘密的技术，它主要用于保护重要的信息，以防止信息的丢失，被破坏，被篡改。秘密共享是指在一个由n个(n＞0)不同实体所构成的集合中，允许一个被

学位

信息安全秘密共享多重秘密共享可验证秘密共享

基于N元共现的机器翻译自动评价的研究

与本文相关的学术论文