汉英自动翻译中一些常见问题的探讨

来源 :校园英语·中旬 | 被引量 : 0次 | 上传用户:q3175
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  引言
  机器翻译又称自动翻译,是利用计算机来进行的语言之间的转换,它是自然语言处理的一个分支,与计算语言学、自然语言理解之间存在着密不可分的关系。它是横跨语言学、数学、计算机科学、翻译学及人工智能等的综合学科,也是信息时代语言应用的一个重要领域。
  一、机器翻译的历史和必要性
  1.机器翻译的历史。20世纪30年代初,法国科学家 G.B.阿尔楚尼提出了用机器来进行语言翻译的想法。随着科技的进步,1946年人类第一台现代电子计算机ENIAC诞生,1949年,韦弗(W. Weaver)在其发表的《翻译备忘录》中,正式提出了机器翻译的思想。中国机器翻译研究开始起步于1957年,是世界上第四个开始搞机器翻译的国家。80年代中期以后,中国机器翻译研究发展进一步加快。90年代初KY-1 和MT/EC863两个机译系统的研制成功,表明中国在机器翻译技术方面取得了历史性突破,随着互联网的普及和人们对翻译需求的迅猛增长,机器翻译又迎来新的发展机遇,我国相继推出了一系列在线翻译系统
  2.机器翻译的必要性。同人工翻译相比,机器翻译有很多优势。首先,存储容量大。存储100万个词条对计算机来说是一件轻而易举的事情,这是人的大脑无法企及的。其次,翻译速度快。机器的翻译速度是人工翻译速度的几十倍,乃至上百倍。再次,更加经济和节省劳动力。据戴尔电脑制造商韦恩·波兰德说,他的公司网站需要提供28种语言,机器翻译已经为其节省了40%的翻译时间。随着对信息获取速度要求的不断提高和国际间交流的日益频繁,人工翻译的低效率、高成本远远不能满足需要,机器翻译将毋庸置疑地成为必要的辅助翻译工具。
  3.机器翻译的主要方法。机器翻译的过程一般可简化为三个阶段:原文分析、原文译文转化和译文生成。表象上,机器翻译的核心问题是翻译的准确性;实质上,体现在技术层面则是机器翻译系统采用的方法论问题。在方法论层面,机器翻译系统可分为基于规则(Rule-Based)和基于语料库(Corpus-Based)两大类。基于规则(Rule-Based)就是由词典和语法规则库构成翻译知识库。基于语料库(Corpus-Based)则是以语料的应用为核心,由经过划分并具有标注的语料库构成知识库。语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。
  二、汉英机器翻译中常见错误分析
  汉英机器翻译中,汉语到英语的转换实际上是一个信息增加的过程。在汉语中所没有的各种形态信息,如单复数、时态、语态等等,在转换和生成中都必须添加上去与过去相比,汉英机器翻译译的速度和质量尽管已明显提高,但与人工翻译相比,机译的文本依然会出现许多错误。下面就在汉英机器翻译过程中常见的错误加以举例分析:
  1.直译的错误。汉语中一词多义现象非常普遍,一个词在与不同的词语搭配时具有不同的词义。人工翻译会根据语境来选择,而机器翻译还达不到通过语境来判断语义,通常是根据该词的第一个词义来直接翻译,这就容易出现一些选词不当或错误的翻译结果。2.被动语态使用错误。汉英机器翻译中,主动语态和被动语态的转换也是对计算机的一个严峻考验,因为汉语句子中并没有相应的语法标志,只能根据句子所处的上下文环境和语义及常识进行判断。3.冠词使用错误。汉语没有冠词,在英语的名词短语中却往往要加上冠词,这其中又分为零冠词、定冠词和不定冠词三种情况。同时,英语中的冠词有时候相当于汉语中的指示代詞“这”、“那”、“该”等。因此,如何把握就成了机器翻译的难题,就会出现表达不当的情况。4.介词及其搭配使用错误。据统计,汉语中总共有介词30个左右,英语中有介词286个,其中在一百个英语句子里几个常用的介词如at,in,on和for的重复出现率为二、三百之多。英语介词不但多,而且使用范围广,所以机器翻译起来往往错误百出。5.句法结构的错误。英语重形合,汉语重意合。所谓“形合”是指语言的词语、分句以及句子之间借助语 言形式手段(如关联词)实现词语或句子的连接,表达语法意义和逻辑意义。
  三、几点建议
  1.正确使用机器翻译。机器翻译发展经历了不同阶段,从开始只能翻译简单的句子,到现在翻译整篇的文章,已有了巨大的发展,在处理专业性强、数量大的技术资料和论文等有相当的优势。随着新机器翻译系统的开发,人工译员不再只是听机器的指令,而是以一种与人工翻译决策过程类似的方式来指引翻译过程。但是,无论用多么复杂的技术制造出来的产品均不能与人类大脑的创造天赋相比。人工译员介入改善翻译文本仍然相当重要。因此,我们应根据自己的实际需求,客观确定机器翻译译文质量的接受值,机器翻译的结果也不能作为最终数据直接用于科研学术研究。
  2.建立功能更加完善的语料库。汉英机器翻译处理的是语言问题,处理语言问题就不应该离开语言知识的辅助,机器翻译时所需要的主要信息是一个大型的双语语料库,若是输入的东西数据库里没有,机器就翻不出人们想要的结果。语言学家经过长期努力创建了含有成千上万条规则的语料库,覆盖了多样的语言现象,但是,如今信息的日新月异导致现实中的语言现象复杂多变,涉及到词法、句法理论以及语用理论等。翻译这些语料不仅需要扎实的语言功底,而且还需要有广阔的文化和百科知识,甚至需要有很高程度的新学科领域的专门知识。作者认为目前的语料库已无法满足汉英机器翻译的需求,这就导致汉英机器翻译中诸多问题的出现。因此,从根本上还要依靠语言学家和每位语言爱好者更加深入细致的研究工作,投入更大的人力和物力,建立一个功能更加完善的语料库,这样可以大大提高机器翻译的正确率及可读性。
其他文献
刘晓庆是中国改革开放前20年中一个典型的投机者和受益者。无论从法制、经济、娱乐中的任何一个角度来看,“刘晓庆税案”都是具有特别意义的案例。刘晓庆是中国改革开放前20
加入世贸组织,就要遵守并执行世贸组织的原则和规则。对政府而言,管理经济的方式面临着挑战;就企业而言,面对国内和国外在平等条件下的竞争,必须尽快完成适应开放型经济的经
二辛酯:本周亚洲市场二辛酯的价格走势仍显十分疲软,市场价格水平基本与上周走势相近。本周市场上的大多数买家大多采取观望态度,他们认为随着聚氯乙烯市场的走软,后市二辛
本文总结了目前城市隐伏活动断层地震勘探方法的最新进展。浅层高分辨率地震勘探是城市隐伏活断层探测手段中最有效、最可靠的方法之一。本文首先总结了地震勘探的基本方法,
伦敦以西伯克郡的泰晤士河沿岸,经常暴雨成灾。为解除洪灾威胁,投资8300万英镑,修建一条长11.5km的分洪渠,以增加河流行洪能力。分洪渠断面为梯形,底宽30m,顶宽45m,高5m,边坡1:1.5。有些
2009年2月11日,福建省人民政府侨务办公室在福建会堂举行全省侨办主任会议,省政府洪捷序副省长出席会议并讲话。我院郑健成副院长、鹿海云主任作为福建省首批海外华文教育基
自从1966年Loosli&Oeschchger测定出大气中的81Kr,就已经有人设想放射性81Kr(半衰期为(2.29±0.11)×105年)可能成为测定古老地下水年龄(105~106年)的有效工具。但一直没有付
经济紧缩迫使企业信息安全的计划者来证明他们的费用支出的合理性,但精确的计算安全破坏带来的花费仍很困难。很长一段时间来(至少在因特网时代是如此),企业并没有将安全列
网络商机让很多人觊觎并投下大把银子,而今年的网络年景不少网络公司因经营不善损失惨重,草草收场。令人愉快的网上购物,因为摸不到实物、不能享受真人服务,而价格并未稍减,
当扶贫攻坚的强劲东风吹拂湘西大地的时候,一项旨在推广普及农业实用技术。提高广大农业劳动者科技素质的“绿色证书”培训工程在花垣境内全面启动。在贫困线上苦苦挣扎的山