论文部分内容阅读
1954年1月7日,美国IBM公司与乔治敦大学合作,成功地进行了世界上第一次机器翻译试验。今年是2014年,是第一次机器翻译试验60周年。第一次机器翻译试验是计算语言学发展史上的大事,也是当代语言学发展史上的大事。在本文中,我们回顾一下第一次机器翻译试验的前前后后,作为对于机器翻译60年的纪念。
用机器来进行翻译的想法,早在古希腊时代就有人提出过了。当时,人们曾经试图设计出一种理想化的语言来代替种类繁多、形式各异的自然语言,以利于不同民族的人进行思想交流。曾提出过不少方案,其中一些方案已经考虑到了如何用机械手段来分析语言的问题。
17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。
笛卡儿(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上编写词典。
17世纪中叶,贝克(Cave Beck)、基尔施(Athanasius Kircher)和贝希尔(Johann Joachim Becher)等人都出版过这类词典。由此开展了关于“普遍语言”的运动,一些人试图在逻辑原则和图形符号的基础上,创造出一种无歧义的语言,这样一来,人们就不会再由于误解而产生交际方面的困难了。
维尔金斯(John Wilkins)(1668)在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character and Philosophical Language)中提出的“中介语”(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。
1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W.Rieger)曾经提出过一种“数字语法”(Zifferngrammatik),这种语法加上词典的辅助,可以利用机械将一种语言翻译成其他多种语言,首次使用了“机器翻译”(德文是“ein mechanisches Uebersetzen”)这个术语。
20世纪30年代初,亚美尼亚裔的法国工程师阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫作“机械脑”(mechanical brain)。这种机械脑的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。阿尔楚尼认为它可以用来记录火车时刻表和银行的帐户,尤其适合作机器词典。在宽纸带上面,每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项。在另外一条纸带上对应的每个词项处,记录着相应的代码,这些代码以打孔来表示。要查询的词项也利用键盘打孔来表示,检索一个词项的时间大约是10到15秒。阿尔楚尼的原型机于1937年正式展出,引起了法国邮政、电信部门的兴趣。但是,由于不久爆发了第二次世界大战,阿尔楚尼的机械脑无法投入使用。
1933年,苏联发明家特洛扬斯基(П.П.ТРОЯНСКИЙ)设计了用机械方法把一种语言翻译为另一种语言的机器,并在同年9月5日登记了他的发明。特洛扬斯基认为翻译可以分为三个阶段,第一阶段由只懂源语言的编辑,将输入的原文分析成特定的逻辑形式,将带有屈折词尾的变形词还原成原形词,并分析出各个单词的句法功能。为此,他创造了一套逻辑分析符号。第二阶段是利用他的翻译机,把源语言的原形词和逻辑符号转换成目标语言的原形词和符号。第三阶段由只懂目标语言的编辑,把目标语言的原形词和符号转换成目标语言。特洛扬斯基认为,他的翻译机只能在第二阶段作为自动词典来使用。不过他相信,只要能够建造出一部专门处理逻辑分析过程的机器,总有一天,上述的整个翻译程序都能够用机器来实现。特洛扬斯基的这种认识,已经超越了“机器词典”的简单想法,比阿尔楚尼又迈进了一步。1939年,特洛扬斯基在他的翻译机上增加了一个用“光元素”操作的存储装置;1941年5月,这部实验性的翻译机已经可以运作;1948年,他计划在此基础上研制一部“电子机械机”(electro-mechanical machine)。但是,由于当时苏联的科学家和语言学家对此反应十分冷淡,特洛扬斯基的翻译机没有得到支持,最后以失败告终。
1946年,美国宾夕法尼亚大学的埃克特(J.P. Eckert)和莫希莱(J.W.Mauchly)设计并制造出了世界上第一台电子计算机“ENIAC”。电子计算机惊人的运算速度,启示着人们考虑翻译技术的革新问题。因此,在电子计算机问世的同一年,英国工程师布斯(A.D. Booth)和美国洛克菲勒基金会副总裁韦弗(W. Weaver)在讨论电子计算机的应用范围时,就提出了利用计算机进行语言自动翻译的想法。
1947年3月6日,布斯与韦弗在纽约的洛克菲勒中心会面,韦弗提出,“如果将计算机用在非数值计算方面,是比较有希望的”。
在韦弗与布斯会面之前,韦弗于在1947年3月4日给控制论学者维纳(N. Wiener)写信,讨论了机器翻译的问题,韦弗说:“我怀疑是否真的建造不出一部能够作翻译的计算机?即使只能翻译科学性的文章(在语义上问题较少),或是翻译出来的结果不怎么优雅(但能够理解),对我而言都值得一试。”可是,维纳给韦弗泼了一瓢冷水,他在4月30日给韦弗的回信中写道:“老实说,恐怕每一种语言的词汇,范围都相当模糊;而其中表示的感情和言外之意,要以类似机器翻译的方法来处理,恐怕不是很乐观的。”
不过,韦弗仍然坚持自己的意见。1949年,韦弗发表了一份以《翻译》为题的备忘录,正式提出了机器翻译问题。在这份备忘录中,他除了提出各种语言都有许多共同特征这一论点之外,还有两点值得我们注意:
第一,他认为翻译类似于解读密码的过程。他说:“当我阅读一篇用汉语写的文章的时候,我可以说,这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我在阅读时,我是在进行解码。”他的这段话非常重要,广为流传,我们把英文原文写在下面: I have a text in front of me which is written in Chinese but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text.
这段话中,韦弗首先提出了用解读密码的方法进行机器翻译的想法,这种想法成为后来噪声信道理论的滥觞。
备忘录中还记载了一个有趣的故事,布朗大学数学系的吉尔曼(R. E. Gilmam)曾经解读了一篇长约一百个词的土耳其文密码,而他既不懂土耳其文,也不知道这篇密码是用土耳其文写的。韦弗认为,吉尔曼的成功足以证明解读密码的技巧和能力不受语言的影响,因而可以用解读密码的办法来进行机器翻译。
第二,他认为原文与译文“说的是同样的事情”,因此,把语言A翻译为语言B,就意味着从语言A出发,经过某一“通用语言”(Universal Language)或“中间语言”(Interlingua),然后转换为语言B,这种“通用语言”或“中间语言”,可以假定是全人类共同的。
可以看出,韦弗把机器翻译仅仅看成一种机械地解读密码的过程,他远远没有看到机器翻译在词法分析、句法分析以及语义分析等方面的复杂性。
早期机器翻译系统的研制受到韦弗的上述思想的很大影响,许多机器翻译研究者都把机器翻译的过程与解读密码的过程相类比,试图通过查询词典的方法来实现词对词的机器翻译,因而译文的可读性很差,难于付诸实用。
由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。1954年,美国乔治敦大学在国际商用机器公司(IBM公司)的协助下,用IBM-701计算机,进行了世界上第一次机器翻译试验,把几个简单的俄语句子翻译成英语;接着,苏联、英国、日本也进行了机器翻译试验,机器翻译出现热潮。
这里,我们向读者展示第一次机器翻译试验的一些珍贵的图片。这是当代语言学发展史上重要事件的回忆,是历史的记录,是科学的档案,值得我们永久珍藏。
图1:第一次机器翻译试验的设计者Hurd,Dostert和Watso
图2:提出了机器翻译中的“支点分析法”(fulcrum analysis)的语言学家Garvin
图3:第一次机器翻译使用的计算机IBM-701
图4:第一次机器翻译在键盘上使用穿孔卡片输入
图5:穿孔卡片上的数据样本(72行卡片,1分钟可转写为150个二进制代码)
图6:第一次机器翻译使用光电管读入数据
图7:第一次机器翻译的程序流程图
图8:第一次机器翻译试验所用的词典
图9:第一次机器翻译在宽行打印机上输出英文
在1954年1月7日向公众表演的时候,他们把俄语句子用英文字母进行转写,使用穿孔卡片输入数据,这样,就可以便于不懂俄语的操作员进行操作了。
我们把第二天(1954年1月8日)《纽约时报》(New York Times),标题为《翻译者701》(701 translator)报道的英文原文抄录如下:
In the demonstration,a girl operator typed out on a keyboard the following Russian text in English characters:“Mi pyeryedayem mislyi posryedstvom ryechi”(Мы передаем мысли посреством речи).The machine printed a translation almost simultaneously:“We transmit thoughts by means of speech.”The operator did not know Russian. Again she types out the meaningless(to her)Russian words:“Vyelyichyina ugla opryedyelyayatsya otnoshyenyiyem dlyini dugi k radyiusu.”(величина угла определяется отношением длины дугы к радиусу)And the machine translated it as:“Magnitude of angle is determined by the relation of length of arc to radius.”
这段英文的汉语译文如下:
在演示时,一个女操作员在键盘上使用穿孔卡片输入转写成英文字母的俄语句子“Mi pyeryedayem mislyi posryedstvom ryechi”,尽管她对于俄语一无所知,可是计算机很快就输出了英语译文:“We transmit thoughts by means of speech.”接着,她又在键盘上使用穿孔卡片输入她完全不懂的另一个俄语句子:“Vyelyichyina ugla opryedyelyayatsya otnoshyenyiyem dlyini dugi k radyiusu.”(величина угла определяется отношением длины дугы к радиусу),计算机几乎同时输出了相应的英语译文“Magnitude of angle is determined by the relation of length of arc to radius.” 第一次机器翻译取得了很大的成功。但是,很快就受到了保守分子的攻击。
1962年8月号的《哈泼杂志》(Harper’s Magazine)发表了古温豪芬(John A. Kouwenhoven)的题为《翻译的困扰》(The trouble with translation)的文章,文章中编造了如下故事:
有几个电子工程师设计了一部自动翻译机,这部机器的词典包含1500个基础英语词汇和相对应的俄语词汇。他们宣称这部机器可以马上进行翻译,而且不会犯人工翻译的错误。第一次试验时,观众要求翻译“Out of sight, out of mind”(眼不见,心不烦)这个句子,灯光一阵闪动之后,翻译出来的俄语句子的意思竟然是“看不见的疯子”(Invisible idiot)。他们觉得这样的谚语式的句子比较难以翻译,于是又给机器翻译系统翻译另一个出自《圣经》的句子“The spirit is willing, but the flesh is weak”(心有余而力不足),机器翻译出来的俄语句子的意思却是“酒保存得很好,但肉已经腐烂”(The liquor is holding out all right, but the meat has spoiled)。
这样的故事显然是凭空捏造的。我们知道,当时美国只研究过把俄语翻译成英语的机器翻译系统,根本没有研究过把英语翻译为俄语的机器翻译系统。这说明文章作者对于美国机器翻译的历史一无所知。尽管这是无中生有编造出来的虚假故事,但是,从中我们可以感觉到当时美国的许多人对机器翻译强烈的不满情绪。
早在机器翻译刚刚问世的时候,美国著名数理逻辑学家Bar-Hillel在1959年就指出,全自动高质量的机器翻译(Fully Automatic,High Quality,MT,简称“FAHQMT”)是不可能的。
Bar-Hillel说明,“FAHQMT”不仅在当时的技术水平下是不可能的,而且在理论原则上也是不可能的。
他举出了如下简单的英语片段,说明要在上下文中发现多义词“pen”的正确译文是非常困难的事情:
John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy.
他的理由如下:
1.“pen”在这里只能翻译为“play-pen”(“游戏的围栏”),而绝对不能翻译为书写工具“钢笔”。
2.要确定“pen”的这个正确的译文是翻译好这段短文的关键所在。
3.而要确定这样的正确译文依赖于计算机对于周围世界的一般知识。
4.但是我们没有办法把这样的知识加到计算机中去。
在机器翻译的早期,Bar-Hillel就科学地预见到了机器翻译将会遇到的困难,显示了他的远见卓识。
1964年,美国科学院成立语言自动处理咨询委员会(Automatic Language Processing Advisory Committee,简称“ALPAC”),调查机器翻译的研究情况,并于1966年11月公布了一个题为《语言与机器》的报告,简称“ALPAC”报告,对机器翻译采取否定的态度,报告宣称:“在目前给机器翻译以大力支持还没有多少理由”;报告还指出,机器翻译研究遇到了难以克服的“语义障碍”(semantic barrier)。
在“ALPAC”报告的影响下,许多国家的机器翻译研究陷入低潮,许多已经建立起来的机器翻译研究单位遇到了行政上和经费上的困难,在世界范围内,机器翻译的热潮突然消失了,出现了空前萧条的局面。
从第一次机器翻译实验的前前后后可以看出,人类为了克服语言障碍进行了艰苦的探索。至今这个问题仍然没有得到很好的解决。
参考文献:
[1]冯志伟.机器翻译研究[M].北京:中国对外翻译出版公司,
2004.
[2]冯志伟.应用语言学新论——语言应用研究的三大支柱[M].北
京:当代世界出版社,2003.
(冯志伟 冯绍锋 浙江杭州 杭州师范大学外国语学院 311121)
用机器来进行翻译的想法,早在古希腊时代就有人提出过了。当时,人们曾经试图设计出一种理想化的语言来代替种类繁多、形式各异的自然语言,以利于不同民族的人进行思想交流。曾提出过不少方案,其中一些方案已经考虑到了如何用机械手段来分析语言的问题。
17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。
笛卡儿(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上编写词典。
17世纪中叶,贝克(Cave Beck)、基尔施(Athanasius Kircher)和贝希尔(Johann Joachim Becher)等人都出版过这类词典。由此开展了关于“普遍语言”的运动,一些人试图在逻辑原则和图形符号的基础上,创造出一种无歧义的语言,这样一来,人们就不会再由于误解而产生交际方面的困难了。
维尔金斯(John Wilkins)(1668)在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character and Philosophical Language)中提出的“中介语”(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。
1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W.Rieger)曾经提出过一种“数字语法”(Zifferngrammatik),这种语法加上词典的辅助,可以利用机械将一种语言翻译成其他多种语言,首次使用了“机器翻译”(德文是“ein mechanisches Uebersetzen”)这个术语。
20世纪30年代初,亚美尼亚裔的法国工程师阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫作“机械脑”(mechanical brain)。这种机械脑的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。阿尔楚尼认为它可以用来记录火车时刻表和银行的帐户,尤其适合作机器词典。在宽纸带上面,每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项。在另外一条纸带上对应的每个词项处,记录着相应的代码,这些代码以打孔来表示。要查询的词项也利用键盘打孔来表示,检索一个词项的时间大约是10到15秒。阿尔楚尼的原型机于1937年正式展出,引起了法国邮政、电信部门的兴趣。但是,由于不久爆发了第二次世界大战,阿尔楚尼的机械脑无法投入使用。
1933年,苏联发明家特洛扬斯基(П.П.ТРОЯНСКИЙ)设计了用机械方法把一种语言翻译为另一种语言的机器,并在同年9月5日登记了他的发明。特洛扬斯基认为翻译可以分为三个阶段,第一阶段由只懂源语言的编辑,将输入的原文分析成特定的逻辑形式,将带有屈折词尾的变形词还原成原形词,并分析出各个单词的句法功能。为此,他创造了一套逻辑分析符号。第二阶段是利用他的翻译机,把源语言的原形词和逻辑符号转换成目标语言的原形词和符号。第三阶段由只懂目标语言的编辑,把目标语言的原形词和符号转换成目标语言。特洛扬斯基认为,他的翻译机只能在第二阶段作为自动词典来使用。不过他相信,只要能够建造出一部专门处理逻辑分析过程的机器,总有一天,上述的整个翻译程序都能够用机器来实现。特洛扬斯基的这种认识,已经超越了“机器词典”的简单想法,比阿尔楚尼又迈进了一步。1939年,特洛扬斯基在他的翻译机上增加了一个用“光元素”操作的存储装置;1941年5月,这部实验性的翻译机已经可以运作;1948年,他计划在此基础上研制一部“电子机械机”(electro-mechanical machine)。但是,由于当时苏联的科学家和语言学家对此反应十分冷淡,特洛扬斯基的翻译机没有得到支持,最后以失败告终。
1946年,美国宾夕法尼亚大学的埃克特(J.P. Eckert)和莫希莱(J.W.Mauchly)设计并制造出了世界上第一台电子计算机“ENIAC”。电子计算机惊人的运算速度,启示着人们考虑翻译技术的革新问题。因此,在电子计算机问世的同一年,英国工程师布斯(A.D. Booth)和美国洛克菲勒基金会副总裁韦弗(W. Weaver)在讨论电子计算机的应用范围时,就提出了利用计算机进行语言自动翻译的想法。
1947年3月6日,布斯与韦弗在纽约的洛克菲勒中心会面,韦弗提出,“如果将计算机用在非数值计算方面,是比较有希望的”。
在韦弗与布斯会面之前,韦弗于在1947年3月4日给控制论学者维纳(N. Wiener)写信,讨论了机器翻译的问题,韦弗说:“我怀疑是否真的建造不出一部能够作翻译的计算机?即使只能翻译科学性的文章(在语义上问题较少),或是翻译出来的结果不怎么优雅(但能够理解),对我而言都值得一试。”可是,维纳给韦弗泼了一瓢冷水,他在4月30日给韦弗的回信中写道:“老实说,恐怕每一种语言的词汇,范围都相当模糊;而其中表示的感情和言外之意,要以类似机器翻译的方法来处理,恐怕不是很乐观的。”
不过,韦弗仍然坚持自己的意见。1949年,韦弗发表了一份以《翻译》为题的备忘录,正式提出了机器翻译问题。在这份备忘录中,他除了提出各种语言都有许多共同特征这一论点之外,还有两点值得我们注意:
第一,他认为翻译类似于解读密码的过程。他说:“当我阅读一篇用汉语写的文章的时候,我可以说,这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我在阅读时,我是在进行解码。”他的这段话非常重要,广为流传,我们把英文原文写在下面: I have a text in front of me which is written in Chinese but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text.
这段话中,韦弗首先提出了用解读密码的方法进行机器翻译的想法,这种想法成为后来噪声信道理论的滥觞。
备忘录中还记载了一个有趣的故事,布朗大学数学系的吉尔曼(R. E. Gilmam)曾经解读了一篇长约一百个词的土耳其文密码,而他既不懂土耳其文,也不知道这篇密码是用土耳其文写的。韦弗认为,吉尔曼的成功足以证明解读密码的技巧和能力不受语言的影响,因而可以用解读密码的办法来进行机器翻译。
第二,他认为原文与译文“说的是同样的事情”,因此,把语言A翻译为语言B,就意味着从语言A出发,经过某一“通用语言”(Universal Language)或“中间语言”(Interlingua),然后转换为语言B,这种“通用语言”或“中间语言”,可以假定是全人类共同的。
可以看出,韦弗把机器翻译仅仅看成一种机械地解读密码的过程,他远远没有看到机器翻译在词法分析、句法分析以及语义分析等方面的复杂性。
早期机器翻译系统的研制受到韦弗的上述思想的很大影响,许多机器翻译研究者都把机器翻译的过程与解读密码的过程相类比,试图通过查询词典的方法来实现词对词的机器翻译,因而译文的可读性很差,难于付诸实用。
由于学者的热心倡导,实业界的大力支持,美国的机器翻译研究一时兴盛起来。1954年,美国乔治敦大学在国际商用机器公司(IBM公司)的协助下,用IBM-701计算机,进行了世界上第一次机器翻译试验,把几个简单的俄语句子翻译成英语;接着,苏联、英国、日本也进行了机器翻译试验,机器翻译出现热潮。
这里,我们向读者展示第一次机器翻译试验的一些珍贵的图片。这是当代语言学发展史上重要事件的回忆,是历史的记录,是科学的档案,值得我们永久珍藏。
图1:第一次机器翻译试验的设计者Hurd,Dostert和Watso
图2:提出了机器翻译中的“支点分析法”(fulcrum analysis)的语言学家Garvin
图3:第一次机器翻译使用的计算机IBM-701
图4:第一次机器翻译在键盘上使用穿孔卡片输入
图5:穿孔卡片上的数据样本(72行卡片,1分钟可转写为150个二进制代码)
图6:第一次机器翻译使用光电管读入数据
图7:第一次机器翻译的程序流程图
图8:第一次机器翻译试验所用的词典
图9:第一次机器翻译在宽行打印机上输出英文
在1954年1月7日向公众表演的时候,他们把俄语句子用英文字母进行转写,使用穿孔卡片输入数据,这样,就可以便于不懂俄语的操作员进行操作了。
我们把第二天(1954年1月8日)《纽约时报》(New York Times),标题为《翻译者701》(701 translator)报道的英文原文抄录如下:
In the demonstration,a girl operator typed out on a keyboard the following Russian text in English characters:“Mi pyeryedayem mislyi posryedstvom ryechi”(Мы передаем мысли посреством речи).The machine printed a translation almost simultaneously:“We transmit thoughts by means of speech.”The operator did not know Russian. Again she types out the meaningless(to her)Russian words:“Vyelyichyina ugla opryedyelyayatsya otnoshyenyiyem dlyini dugi k radyiusu.”(величина угла определяется отношением длины дугы к радиусу)And the machine translated it as:“Magnitude of angle is determined by the relation of length of arc to radius.”
这段英文的汉语译文如下:
在演示时,一个女操作员在键盘上使用穿孔卡片输入转写成英文字母的俄语句子“Mi pyeryedayem mislyi posryedstvom ryechi”,尽管她对于俄语一无所知,可是计算机很快就输出了英语译文:“We transmit thoughts by means of speech.”接着,她又在键盘上使用穿孔卡片输入她完全不懂的另一个俄语句子:“Vyelyichyina ugla opryedyelyayatsya otnoshyenyiyem dlyini dugi k radyiusu.”(величина угла определяется отношением длины дугы к радиусу),计算机几乎同时输出了相应的英语译文“Magnitude of angle is determined by the relation of length of arc to radius.” 第一次机器翻译取得了很大的成功。但是,很快就受到了保守分子的攻击。
1962年8月号的《哈泼杂志》(Harper’s Magazine)发表了古温豪芬(John A. Kouwenhoven)的题为《翻译的困扰》(The trouble with translation)的文章,文章中编造了如下故事:
有几个电子工程师设计了一部自动翻译机,这部机器的词典包含1500个基础英语词汇和相对应的俄语词汇。他们宣称这部机器可以马上进行翻译,而且不会犯人工翻译的错误。第一次试验时,观众要求翻译“Out of sight, out of mind”(眼不见,心不烦)这个句子,灯光一阵闪动之后,翻译出来的俄语句子的意思竟然是“看不见的疯子”(Invisible idiot)。他们觉得这样的谚语式的句子比较难以翻译,于是又给机器翻译系统翻译另一个出自《圣经》的句子“The spirit is willing, but the flesh is weak”(心有余而力不足),机器翻译出来的俄语句子的意思却是“酒保存得很好,但肉已经腐烂”(The liquor is holding out all right, but the meat has spoiled)。
这样的故事显然是凭空捏造的。我们知道,当时美国只研究过把俄语翻译成英语的机器翻译系统,根本没有研究过把英语翻译为俄语的机器翻译系统。这说明文章作者对于美国机器翻译的历史一无所知。尽管这是无中生有编造出来的虚假故事,但是,从中我们可以感觉到当时美国的许多人对机器翻译强烈的不满情绪。
早在机器翻译刚刚问世的时候,美国著名数理逻辑学家Bar-Hillel在1959年就指出,全自动高质量的机器翻译(Fully Automatic,High Quality,MT,简称“FAHQMT”)是不可能的。
Bar-Hillel说明,“FAHQMT”不仅在当时的技术水平下是不可能的,而且在理论原则上也是不可能的。
他举出了如下简单的英语片段,说明要在上下文中发现多义词“pen”的正确译文是非常困难的事情:
John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy.
他的理由如下:
1.“pen”在这里只能翻译为“play-pen”(“游戏的围栏”),而绝对不能翻译为书写工具“钢笔”。
2.要确定“pen”的这个正确的译文是翻译好这段短文的关键所在。
3.而要确定这样的正确译文依赖于计算机对于周围世界的一般知识。
4.但是我们没有办法把这样的知识加到计算机中去。
在机器翻译的早期,Bar-Hillel就科学地预见到了机器翻译将会遇到的困难,显示了他的远见卓识。
1964年,美国科学院成立语言自动处理咨询委员会(Automatic Language Processing Advisory Committee,简称“ALPAC”),调查机器翻译的研究情况,并于1966年11月公布了一个题为《语言与机器》的报告,简称“ALPAC”报告,对机器翻译采取否定的态度,报告宣称:“在目前给机器翻译以大力支持还没有多少理由”;报告还指出,机器翻译研究遇到了难以克服的“语义障碍”(semantic barrier)。
在“ALPAC”报告的影响下,许多国家的机器翻译研究陷入低潮,许多已经建立起来的机器翻译研究单位遇到了行政上和经费上的困难,在世界范围内,机器翻译的热潮突然消失了,出现了空前萧条的局面。
从第一次机器翻译实验的前前后后可以看出,人类为了克服语言障碍进行了艰苦的探索。至今这个问题仍然没有得到很好的解决。
参考文献:
[1]冯志伟.机器翻译研究[M].北京:中国对外翻译出版公司,
2004.
[2]冯志伟.应用语言学新论——语言应用研究的三大支柱[M].北
京:当代世界出版社,2003.
(冯志伟 冯绍锋 浙江杭州 杭州师范大学外国语学院 311121)