邱懋如翻译等值模式指导下的机器翻译系统评价标准研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:ihsc2Xid84
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从机器翻译在计算机上实现,研究者们就开始对其进行人工评价和自动评价。一些研究者根据自己的使用经验总结了机器翻译的优势与劣势,不仅为机器翻译系统用户提供了如何合理使用机器翻译系统的方法,也为机器翻译系统开发者提供了改进意见。由于人工评价多为描述性评价,很少参照相应标准,因此评价结果过于主观。另一些研究者则是程序员,他们发明了BLEU、NIST和METEOR等算法来自动计算译文的平均质量。尽管这些机器翻译自动评价解决了人工评价成本高,耗时长等问题,但这些自动评价方法多数以字符串相似度高低决定译文优劣,评价结果的信度值得怀疑。为了解决以往机器翻译评价研究中存在的不足,本文试图建立一套客观、综合的机器翻译系统评价标准,以期揭示机器翻译系统的能力与不足,从而提高其使用效率。为了保证评价的全面性和系统性,评价标准以邱懋如教授提出的“等值与翻译等值模式”为基础,同时遵循机器翻译系统的特性制定,以保障评价能够实现预期目标。论文第一章回顾了以往的机器翻译评价研究,其后第二章介绍了邱懋如教授的“等值与翻译等值模式”。第三章基于邱懋如的“等值与翻译等值模式”,结合机器翻译特性,建立了一套客观、综合的机器翻译系统评价标准,其中规定的了评价过程以及结果分析方法。第四章根据该评价标准编制“等职评价者”软件,实现评价过程的自动化。本文的结论是:依据该标准进行评价,可以揭示机器翻译系统是否能实现邱懋如提出的各层面的等值,这不仅能帮助用户找到综合翻译质量最佳的系统,还能够发现哪种系统更为合适。此外,通过实验证明,“等职评价者”能够量化评价机器翻译系统各个层面的能力,也能够成功的比较多个系统。
其他文献
就居住区规划阶段的声环境设计目标来说,我国与发达国家差距较大,甚至没有完善的规范体系;就设计方法来说,我国很少有设计师在规划阶段主动考虑声环境设计。设计师应将声环境
从2002年11月党的十六大报告提出"教育为社会主义现代化建设服务,为人民服务"到2012年11月党的十八大报告再度提出"教育为社会主义现代化建设服务、为人民服务",前后10年,教
氨基膦酸螯合离子交换剂是以—NHCH2P(O)(OH)2为功能基的一类螯合离子交换剂,结构中的胺基可以提供N作为螯合原子,磷酸具有强酸性,可以提供多个H+进行离子交换,因此能与多种
本项研究使用两名三岁后佩戴耳蜗说普通话的北京儿童的语音材料研究儿童获得普通话声调的早期过程。我们截取两名儿童语料中的可识别的词汇和语句,使用听觉辨音和语音分析相
本文主要目的是希望通过写作学的思维操作原理对六书之一“会意”的现有研究进行梳理,探究会意的真实含义,从而对会意重新界定和解读。本文研究表明:会意字的造字本身就是微观的
目的观察五味消毒饮结合负压引流治疗热毒炽盛型下肢骨折内固定术后早期感染的临床疗效。方法选取2012年2月至2013年6月因下肢骨折钢板内固定术后早期感染就诊于南京军区福州
语言是一个民族的历史和文化,以及风俗习惯的变现形式,所以它具有社会性和地方性、时间性。他不仅表达着这个民族的意识形态,而且还变现这个民族的历史。因而语言不只是我们
对比了丁腈橡胶NBR2805E与市场同类产品Nancar1043N、N41E、JSR 240S和Nancar2865的结构与性能关系。结果表明,NBR2805E与JSR240S、Nancar2865丙烯腈含量相当,顺式1,4-丁二烯
<正>2010年7月15日,甘肃交通广播在进行了充分的市场调研后对节目进行了改版。据北京赛力信市场调查公司对2011年4月兰州广播收听市场的收听率调查,在兰州广播市场,甘肃广播