第一次机器翻译试验的前前后后

来源 :现代语文(语言研究) | 被引量 : 0次 | 上传用户:ZHANGXIANYU0000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  1954年1月7日,美国IBM公司与乔治敦大学合作,成功地进行了世界上第一次机器翻译试验。今年是2014年,是第一次机器翻译试验60周年。第一次机器翻译试验是计算语言学发展史上的大事,也是当代语言学发展史上的大事。在本文中,我们回顾一下第一次机器翻译试验的前前后后,作为对于机器翻译60年的纪念。
  用机器来进行翻译的想法,早在古希腊时代就有人提出过了。当时,人们曾经试图设计出一种理想化的语言来代替种类繁多、形式各异的自然语言,以利于不同民族的人进行思想交流。曾提出过不少方案,其中一些方案已经考虑到了如何用机械手段来分析语言的问题。
  17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。
  笛卡儿(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上编写词典。
  17世纪中叶,贝克(Cave Beck)、基尔施(Athanasius Kircher)和贝希尔(Johann Joachim Becher)等人都出版过这类词典。由此开展了关于“普遍语言”的运动,一些人试图在逻辑原则和图形符号的基础上,创造出一种无歧义的语言,这样一来,人们就不会再由于误解而产生交际方面的困难了。
  维尔金斯(John Wilkins)(1668)在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character and Philosophical Language)中提出的“中介语”(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。
  1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W.Rieger)曾经提出过一种“数字语法”(Zifferngrammatik),这种语法加上词典的辅助,可以利用机械将一种语言翻译成其他多种语言,首次使用了“机器翻译”(德文是“ein mechanisches Uebersetzen”)这个术语。
  20世纪30年代初,亚美尼亚裔的法国工程师阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫作“机械脑”(mechanical brain)。这种机械脑的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。阿尔楚尼认为它可以用来记录火车时刻表和银行的帐户,尤其适合作机器词典。在宽纸带上面,每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项。在另外一条纸带上对应的每个词项处,记录着相应的代码,这些代码以打孔来表示。要查询的词项也利用键盘打孔来表示,检索一个词项的时间大约是10到15秒。阿尔楚尼的原型机于1937年正式展出,引起了法国邮政、电信部门的兴趣。但是,由于不久爆发了第二次世界大战,阿尔楚尼的机械脑无法投入使用。
  1933年,苏联发明家特洛扬斯基(П.П.ТРОЯНСКИЙ)设计了用机械方法把一种语言翻译为另一种语言的机器,并在同年9月5日登记了他的发明。特洛扬斯基认为翻译可以分为三个阶段,第一阶段由只懂源语言的编辑,将输入的原文分析成特定的逻辑形式,将带有屈折词尾的变形词还原成原形词,并分析出各个单词的句法功能。为此,他创造了一套逻辑分析符号。第二阶段是利用他的翻译机,把源语言的原形词和逻辑符号转换成目标语言的原形词和符号。第三阶段由只懂目标语言的编辑,把目标语言的原形词和符号转换成目标语言。特洛扬斯基认为,他的翻译机只能在第二阶段作为自动词典来使用。不过他相信,只要能够建造出一部专门处理逻辑分析过程的机器,总有一天,上述的整个翻译程序都能够用机器来实现。特洛扬斯基的这种认识,已经超越了“机器词典”的简单想法,比阿尔楚尼又迈进了一步。1939年,特洛扬斯基在他的翻译机上增加了一个用“光元素”操作的存储装置;1941年5月,这部实验性的翻译机已经可以运作;1948年,他计划在此基础上研制一部“电子机械机”(electro-mechanical machine)。但是,由于当时苏联的科学家和语言学家对此反应十分冷淡,特洛扬斯基的翻译机没有得到支持,最后以失败告终。
  1946年,美国宾夕法尼亚大学的埃克特(J.P. Eckert)和莫希莱(J.W.Mauchly)设计并制造出了世界上第一台电子计算机“ENIAC”。电子计算机惊人的运算速度,启示着人们考虑翻译技术的革新问题。因此,在电子计算机问世的同一年,英国工程师布斯(A.D. Booth)和美国洛克菲勒基金会副总裁韦弗(W. Weaver)在讨论电子计算机的应用范围时,就提出了利用计算机进行语言自动翻译的想法。
  1947年3月6日,布斯与韦弗在纽约的洛克菲勒中心会面,韦弗提出,“如果将计算机用在非数值计算方面,是比较有希望的”。
  在韦弗与布斯会面之前,韦弗于在1947年3月4日给控制论学者维纳(N. Wiener)写信,讨论了机器翻译的问题,韦弗说:“我怀疑是否真的建造不出一部能够作翻译的计算机?即使只能翻译科学性的文章(在语义上问题较少),或是翻译出来的结果不怎么优雅(但能够理解),对我而言都值得一试。”可是,维纳给韦弗泼了一瓢冷水,他在4月30日给韦弗的回信中写道:“老实说,恐怕每一种语言的词汇,范围都相当模糊;而其中表示的感情和言外之意,要以类似机器翻译的方法来处理,恐怕不是很乐观的。”
  不过,韦弗仍然坚持自己的意见。1949年,韦弗发表了一份以《翻译》为题的备忘录,正式提出了机器翻译问题。在这份备忘录中,他除了提出各种语言都有许多共同特征这一论点之外,还有两点值得我们注意:
  第一,他认为翻译类似于解读密码的过程。他说:“当我阅读一篇用汉语写的文章的时候,我可以说,这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我在阅读时,我是在进行解码。”他的这段话非常重要,广为流传,我们把英文原文写在下面:   I have a text in front of me which is written in Chinese but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text.
  这段话中,韦弗首先提出了用解读密码的方法进行机器翻译的想法,这种想法成为后来噪声信道理论的滥觞。
  备忘录中还记载了一个有趣的故事,布朗大学数学系的吉尔曼(R. E. Gilmam)曾经解读了一篇长约一百个词的土耳其文密码,而他既不懂土耳其文,也不知道这篇密码是用土耳其文写的。韦弗认为,吉尔曼的成功足以证明解读密码的技巧和能力不受语言的影响,因而可以用解读密码的办法来进行机器翻译。
  第二,他认为原文与译文“说的是同样的事情”,因此,把语言A翻译为语言B,就意味着从语言A出发,经过某一“通用语言”(Universal Language)或“中间语言”(Interlingua),然后转换为语言B,这种“通用语言”或“中间语言”,可以假定是全人类共同的。
  可以看出,韦弗把机器翻译仅仅看成一种机械地解读密码的过程,他远远没有看到机器翻译在词法分析、句法分析以及语义分析等方面的复杂性。
  早期机器翻译系统的研制受到韦弗的上述思想的很大影响,许多机器翻译研究者都把机器翻译的过程与解读密码的过程相类比,试图通过查询词典的方法来实现词对词的机器翻译,因而译文的可读性很差,难于付诸实用。
  由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。1954年,美国乔治敦大学在国际商用机器公司(IBM公司)的协助下,用IBM-701计算机,进行了世界上第一次机器翻译试验,把几个简单的俄语句子翻译成英语;接着,苏联、英国、日本也进行了机器翻译试验,机器翻译出现热潮。
  这里,我们向读者展示第一次机器翻译试验的一些珍贵的图片。这是当代语言学发展史上重要事件的回忆,是历史的记录,是科学的档案,值得我们永久珍藏。
  图1:第一次机器翻译试验的设计者Hurd,Dostert和Watso
  图2:提出了机器翻译中的“支点分析法”(fulcrum analysis)的语言学家Garvin
  图3:第一次机器翻译使用的计算机IBM-701
  图4:第一次机器翻译在键盘上使用穿孔卡片输入
  图5:穿孔卡片上的数据样本(72行卡片,1分钟可转写为150个二进制代码)
  图6:第一次机器翻译使用光电管读入数据
  图7:第一次机器翻译的程序流程图
  图8:第一次机器翻译试验所用的词典
  图9:第一次机器翻译在宽行打印机上输出英文
  在1954年1月7日向公众表演的时候,他们把俄语句子用英文字母进行转写,使用穿孔卡片输入数据,这样,就可以便于不懂俄语的操作员进行操作了。
  我们把第二天(1954年1月8日)《纽约时报》(New York Times),标题为《翻译者701》(701 translator)报道的英文原文抄录如下:
  In the demonstration,a girl operator typed out on a keyboard the following Russian text in English characters:“Mi pyeryedayem mislyi posryedstvom ryechi”(Мы передаем мысли посреством речи).The machine printed a translation almost simultaneously:“We transmit thoughts by means of speech.”The operator did not know Russian. Again she types out the meaningless(to her)Russian words:“Vyelyichyina ugla opryedyelyayatsya otnoshyenyiyem dlyini dugi k radyiusu.”(величина угла определяется отношением длины дугы к радиусу)And the machine translated it as:“Magnitude of angle is determined by the relation of length of arc to radius.”
  这段英文的汉语译文如下:
  在演示时,一个女操作员在键盘上使用穿孔卡片输入转写成英文字母的俄语句子“Mi pyeryedayem mislyi posryedstvom ryechi”,尽管她对于俄语一无所知,可是计算机很快就输出了英语译文:“We transmit thoughts by means of speech.”接着,她又在键盘上使用穿孔卡片输入她完全不懂的另一个俄语句子:“Vyelyichyina ugla opryedyelyayatsya otnoshyenyiyem dlyini dugi k radyiusu.”(величина угла определяется отношением длины дугы к радиусу),计算机几乎同时输出了相应的英语译文“Magnitude of angle is determined by the relation of length of arc to radius.”   第一次机器翻译取得了很大的成功。但是,很快就受到了保守分子的攻击。
  1962年8月号的《哈泼杂志》(Harper’s Magazine)发表了古温豪芬(John A. Kouwenhoven)的题为《翻译的困扰》(The trouble with translation)的文章,文章中编造了如下故事:
  有几个电子工程师设计了一部自动翻译机,这部机器的词典包含1500个基础英语词汇和相对应的俄语词汇。他们宣称这部机器可以马上进行翻译,而且不会犯人工翻译的错误。第一次试验时,观众要求翻译“Out of sight, out of mind”(眼不见,心不烦)这个句子,灯光一阵闪动之后,翻译出来的俄语句子的意思竟然是“看不见的疯子”(Invisible idiot)。他们觉得这样的谚语式的句子比较难以翻译,于是又给机器翻译系统翻译另一个出自《圣经》的句子“The spirit is willing, but the flesh is weak”(心有余而力不足),机器翻译出来的俄语句子的意思却是“酒保存得很好,但肉已经腐烂”(The liquor is holding out all right, but the meat has spoiled)。
  这样的故事显然是凭空捏造的。我们知道,当时美国只研究过把俄语翻译成英语的机器翻译系统,根本没有研究过把英语翻译为俄语的机器翻译系统。这说明文章作者对于美国机器翻译的历史一无所知。尽管这是无中生有编造出来的虚假故事,但是,从中我们可以感觉到当时美国的许多人对机器翻译强烈的不满情绪。
  早在机器翻译刚刚问世的时候,美国著名数理逻辑学家Bar-Hillel在1959年就指出,全自动高质量的机器翻译(Fully Automatic,High Quality,MT,简称“FAHQMT”)是不可能的。
  Bar-Hillel说明,“FAHQMT”不仅在当时的技术水平下是不可能的,而且在理论原则上也是不可能的。
  他举出了如下简单的英语片段,说明要在上下文中发现多义词“pen”的正确译文是非常困难的事情:
  John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy.
  他的理由如下:
  1.“pen”在这里只能翻译为“play-pen”(“游戏的围栏”),而绝对不能翻译为书写工具“钢笔”。
  2.要确定“pen”的这个正确的译文是翻译好这段短文的关键所在。
  3.而要确定这样的正确译文依赖于计算机对于周围世界的一般知识。
  4.但是我们没有办法把这样的知识加到计算机中去。
  在机器翻译的早期,Bar-Hillel就科学地预见到了机器翻译将会遇到的困难,显示了他的远见卓识。
  1964年,美国科学院成立语言自动处理咨询委员会(Automatic Language Processing Advisory Committee,简称“ALPAC”),调查机器翻译的研究情况,并于1966年11月公布了一个题为《语言与机器》的报告,简称“ALPAC”报告,对机器翻译采取否定的态度,报告宣称:“在目前给机器翻译以大力支持还没有多少理由”;报告还指出,机器翻译研究遇到了难以克服的“语义障碍”(semantic barrier)。
  在“ALPAC”报告的影响下,许多国家的机器翻译研究陷入低潮,许多已经建立起来的机器翻译研究单位遇到了行政上和经费上的困难,在世界范围内,机器翻译的热潮突然消失了,出现了空前萧条的局面。
  从第一次机器翻译实验的前前后后可以看出,人类为了克服语言障碍进行了艰苦的探索。至今这个问题仍然没有得到很好的解决。
  参考文献:
  [1]冯志伟.机器翻译研究[M].北京:中国对外翻译出版公司,
  2004.
  [2]冯志伟.应用语言学新论——语言应用研究的三大支柱[M].北
  京:当代世界出版社,2003.
  (冯志伟 冯绍锋 浙江杭州 杭州师范大学外国语学院 311121)
其他文献
摘 要:量词作为汉语中的一类特殊词,是对外汉语教学中的一大难点。本文在已有的现代汉语量词研究与对外汉语量词教学方法的基础上,以相似量词“部”和“台”为例,对其适配度进行考察。  关键词:量词 适配度 对外汉语教学  一、引言  留学生《发展汉语》初级综合课本中提到了“部”和“台”两个量词,但是教材中只用“measure word”进行了简单介绍。本文将基于汉语教学,以相似量词“部”和“台”为例进行
期刊
摘 要:语言是社会的,也是空间的。空间通过某种关联将个体联系起来,并且通过不同的形式向人们传达不同的感受、指引或约束;空间的行为都包含了某种程度的交流,又反过来影响人们的生活。本文以空间语言为切入点,对民国时期宁波公园这一空间加以分析和探讨,以管窥空间、语言与社会文化的关系,并侧面反映近代宁波社会的变迁的侧面。  关键词:空间语言 符号 空间 社会文化 公园  一、引言  语言与空间是密不可分的。
期刊
摘 要:类层级结构理论和“外延内涵传承说”为研究不同语言词汇的对等翻译提供了新的视角和方法。依据该理论和学说,以汉语“癌”和英语“cancer”为例,通过逻辑推演的方法,分析了两个词的对等翻译是如何实现的。实现的步骤共有三个:隐喻的过程、成为“死隐喻”的过程和等量置换的过程。通过以上步骤,两个词的对等翻译的理据得到明确揭示,类层级结构理论和“外延内涵传承说”的解释力也成功地拓展到翻译学领域。  关
期刊
摘 要:本文通过对唐诗《江雪》及其四个英译本逐字逐句的深入解读,比较分析了四个译本分别采用的翻译策略和其对原诗意境的传达程度。以该诗与译文解析为例,归纳得出在汉诗英译过程中对意境把握的三个层次,总结出诗歌译者的责任与诗歌翻译的规范。  关键词:古诗 翻译 意境  一、引言  中国古诗文化源远流长,历来被视为传统文化之宝藏。随着文化浪潮席卷全球,更多的中国传统文化流传国外,其中必然少不了中华文化瑰宝
期刊
摘 要:关联理论既是一种认知理论,又是一种交际理论。在关联理论视角下,翻译也是一种交际行为,这说明二者的兼容性。本文旨在关联理论的指导下,结合《围城》中相关的具体隐喻汉英翻译实例,分析探讨隐喻汉英翻译策略和方法,以此发挥关联理论的指导作用。  关键词:关联理论 隐喻汉英翻译 《围城》  一、引言  钱钟书是20世纪40年代才华横溢、享誉极高的批判现实主义作家。《围城》是钱先生唯一的长篇小说,也是一
期刊
摘 要:宁波方言中存在大量的时间词汇。概念隐喻理论分析中有三类认知机制可以解释时间词汇的理解过程,分别是用空间认知时间、用人体认知时间、用民俗认知时间。宁波方言中时间词汇的隐喻认知机制证明了Lakoff关于“隐喻是人的认知手段”的理论,同时也指出在英语和汉语中对时间词汇的理解存在异同。  关键词:宁波方言 时间词 隐喻 认知机制  ?一、宁波方言与宁波方言中的时间隐喻词汇  宁波话属于吴语太湖片(
期刊
摘 要:随着国际旅游业的迅猛发展,国内旅游景点介绍文本的英译需求日渐突出。本文从文本类型理论的角度分析了旅游景点介绍英译过程中存在的难点及翻译策略,总结了文本类型理论在旅游景点介绍文本英译实践中的重要意义。  关键词:文本类型理论 旅游景点介绍 英译汉  一、引言  随着全球化程度的加深和我国对外开放的进一步深化,国外来华游客的数量也在急剧增长。然而,目前国内旅游景点介绍的英译本普遍存在很多问题—
期刊
摘 要:本文以2012年3月14日温家宝总理在两会之后的最后一次记者招待会上回答记者提问时引用的古诗词翻译为例进行评析,结合口译原则说明以塞莱丝柯维奇为代表的法国释意学派释意理论,在中国古诗词口译中很好地将诗文的形式与内涵用现代的外语语言忠实地再现出来,使听者能够从译文中获得尽可能与本国听者同样的共鸣和美感。  關键词: 释意理论 脱离语言外壳 古诗词口译  一、引言  根据释意派口译理论,口译包
期刊
摘 要:民国时期的广告语言在内容、风格、形式上都有着鲜明的特点:在内容上它能够准确反映时局,在民族危机的情形下,广告以“服用国货”为号召;在风格上,广告语言风格多元化,在文言、白话和文白夹杂三种语言风格中自由选择;在形式上,极力追求美观,尤其是对称的形式犹为彼时广告所热衷。  关键词:民国 广告语言 内容 风格 形式  “广告语言是特定的语言符号在广告信息传播时的具体运用及其成品”[1],广告语言
期刊
摘 要:以2010~2012年汉语和泰语中出现的新词语为研究对象,通过整理、统计、对比和分析,把汉语新词语分为新造词、外来词、网络词等类别,将泰语新词语分为新造词、重复词等类别。通过对汉泰新词语的音节研究,发现汉语新词语以三音节词为主,泰语的新词语以传统的双音节为主。  关键词:汉泰语言对比 新词语 类型 音节  一、汉泰新词语的类型对比  汉泰语言中每年都会出现大量的新词语。按照新词语产生的方式
期刊