变换分析在机器翻译中的作用

来源 :现代语文(语言研究) | 被引量 : 0次 | 上传用户:superrocli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  1.引言
  机器翻译(简称MT) 是相对于人的翻译而言的,就是应用计算机实现从一种自然语言文本(称为“源语言”)到另一种自然语言文本(称为“目标语言”)的翻译。MT 要实现对自然语言的翻译,必然涉及对自然语言的理解。因此, MT 是自然语言处理研究领域的一个分支。从美国人维弗(Warren·Weaver)于1949 年发表《翻译》备忘录并正式提出机器翻译的思想以来,机器翻译可以说经历了一条曲折而漫长的道路,从初期的发展到六十年代的停滞状态,再到复苏和八九十年代的发展,当今,随着国际互联网的日益普及和国际经济文化交流的日益频繁,对语言的自动翻译系统的需求变得更加迫切。然而,机器翻译的研究与开发却极为困难。机器翻译的译文质量仍然让人望而却步。由于机器翻译所要处理的自然语言是丰富而复杂的,尤其是汉语重意合轻形式,以意驭形的特点,使得对语言的分析要把语法和语义分析结合才能取得较好的效果;另外汉语语用上的众多的省略现象使汉语理解非常依赖于语境知识;同时,汉语的歧义现象严重,词法分析上的兼类现象,句法分析上的同形异构等对计算机来说都是很难处理的。计算机只是利用构成无限多句子的有限的词和语法规则等来对自然语言进行理解。因此,在句子的层面上,机器翻译的过程就转化为依据某种语法理论提供的规则或计算机所存储的一些知识库来分析自然语言句子的过程。本文就变换分析在机器翻译中的运用作了一些尝试,指出了变换分析在自然语言理解与机器翻译中的作用。
  
  2.变换分析
  变换分析是语法研究中的一种理论和方法。语言中大量同形异义格式和异形同义格式的存在,使得很多语法学家运用格式之间的可变换关系来研究语言问题。变换(transformation) 在西方语言学中有三种含义,第一种含义是指英国语言学家纳斯菲尔德(J.C.Nesfield)的“把一个语法形式改为另一个语法形式而不改变它的意义”的句子“改换”,如疑问句和陈述句的改换、主动句和被动句的改换等等;第二种含义是指美国语言学家海里斯(Z.Harris) 在20世纪50年代初提出的不同结构的序列之间的等价“替换”;第三种含义是指美国语言学家海里斯的学生乔姆斯基(N.Chomsky) 创立的“转换生成语法”的“转换”,即指的是句子从深层结构如何生成表层结构的“转换”。我国语言学界一般把海里斯的“transformation”称为“变换”。在我国,将变换作为汉语语法分析的一种重要方法的是朱德熙。他认为,变换可理解为存在于两种结构不同的句式之间的依存关系,可以作为语法分析或句法分析的手段或方法来运用。
  变换分析,一般先要对某一句法结构(通常称原式) 进行移位、删除、添加、替代、合并等的操作整合,得出另一不同形式的句法结构(通常称变换式) ,再通过比较、分析、归纳等抽象概括,揭示出句法性质,得出语法规律或解释语法现象。
  彭玉兰在《变换分析法在汉语中的运用》(人大复印资料《语言文字学》,1997年第3期)中根据原式与变换式之间的语义是否相当把变换类型分为句义内变换和句义外变换两种。句义内变换即变换前后句子的意义相当,变换的结果是构成同义句式。它又分为三种情况: ①移位变换,变换式中同现成分与原式的位置不同。②补丢变换,补是通过添加,让变换式把原式隐含的语义成分、关系和结构表现出来;丢是通过删除来给语言成分定性。③替词变换,变换式中某词语替换原式中某一相应词语,变换前后的非同现成分具有相互注释性。句义外变换一般表现为变换式在原式句义之外的添加成分,变换的结果是构成非同义句式。
  
  3.变换分析在机器翻译中的运用
  英译汉时,通常先分析句子的结构、形式,再确定句子的功能和意义;而汉译英时,往往要先分析句子的功能、意义,才能确定句子的结构和形式。机器翻译在源语是英语时,从结构到功能、从形式到意义的分析正好符合这种顺序;而当源语是汉语时,则应在分析句法形式和语义结构的基础上去探求合理的形式。因此,对句子的变换分析就比较符合这种汉—英翻译的需要。
  3.1 可变换句式之间的平行性原则决定了可变换句式之间的同义关系,通过变换可以发现、了解、确定句式之间的同义关系,为语用选择提供了可比较的前提条件,从而也为语篇翻译中的前后一致、主题一致提供了可能实现的手段。
  在语用中,存在着话语的焦点,即表达的重点;在语篇中,主语一致可使文章更加流畅易懂,句式之间的同义变换可用于机器翻译后期,对已生成的粗糙的目标语言进行修改、润色,使之在与原文意义相符的基础上主题更加突出,语句间衔接更加连贯。在语用上,把字结构的规律是它始终处于一个明确的因果关系的意义范畴之中,当需要强调这种因果关系时,便使用把字句,其语义重心或焦点在谓语部分;被字句是依靠介词“被”引进谓语动词的动作主体于动词前作状语,而把动作涉及的对象置于句首的句式,被字句中主语的被处置性对主语来说通常是不如意的,其信息焦点一般在句末。下面以主动句和带“被”字的被字句之间的变换来说明,如:
  (1)他不小心摔碎了花瓶。→(2)他不小心把花瓶摔碎了。→(3)花瓶被他不小心摔碎了。→(4)花瓶是他不小心摔碎了。
  在这些句子里,题元关系是一致的,即[施事:他][受事:花瓶],但话语的焦点则不同,(1)句是陈述句式。(2)句中,“把”字后面的“花瓶”为句子焦点;(3)句中,“被”字后面的“他”“不小心”都可以成为句子焦点;(4)句中,“花瓶”是主题,“他”或“不小心”是句子焦点。
  在机器翻译中,主动句和带“被”字的被字句之间的变换可以描写为:
  ⑴ S → NP1 VP
  ⑵ VP → V NP2
  ⑶ NP1 V NP2 → NP2 被 NP1 V
  同义句式变换的处理流程图可表示为:
  


  3.2 变换分析可以用来分化歧义结构,
  如:他谁都不相信。其内在语义特征有两种:
  


  这句话结构可以描写为Np1+Np2+Vp,变换后对应着两种句式:
  ⑴Np1+Vp+Np2
  ⑵Np2+Vp+Np1
  其对应的英文翻译分别为:
  ⑴He believes in nobody.
  ⑵Nobody believes in him.
  3.3 机器翻译中,当处理复杂的长句时,变换分析可以加深对原语的理解,从而对目的语句式的选择和语义的分句表述提供借鉴。以汉英翻译为例,下面将对汉语中的述补结构,连动句,兼语句作具体分析说明。
  在汉语述补结构中,表层句法结构相同,深层语义结构可以不同,补语的语义指向也可以不同,通过变换分析可以发现其中的不同,有利于机器翻译中原语与目标语的意义一致。
  ⑴他喝完了水。他喝水,水完了。
  ⑵他喝饱了水。他喝水,他饱了。
  从上面的变换可以看出,⑴句中的补语“完”的语义指向是作为受事的“水”, ⑵句中的补语“饱”的语义指向是作为施事的“他”,因此,在进行汉英翻译时,如果汉语中的补语在译为英语时用从句或复句来表达的话,基于变换的原语分析则为从句种类的选择或复句连词的选用提供了语义上的依据。
  由于汉语动词没有定式和不定式之分,使得汉语句子谓语中可以连用多个动词性短语作谓语 ,这是现代汉语谓语部分复杂性的主要表现。而动词连用的格式又可以分为连动句和兼语句两类。同时,现代汉语的宾语部分也比较复杂,可以用一个完整的句子来做宾语。对这三类句子可以用变换分析来区分。先看下面的例子:
  ⑶我出去打电话。我出去,我打电话。
  ⑷我通知他买书。我通知他,他买书。
  ⑸我知道他买书。我知道他买书这件事。
  ⑶句为典型的连动句,“出去”和“打”两个动词共享一个施事主语“我”。
  ⑷句是典型的兼语句,“他”既是“通知”的受事宾语,又是“去北京”的施事主语。
  ⑸句“他买书”是动词“知道”的受事。三句的变换规则可以形式化表述为:
  ⑶S V1 V2 O?S V1,S V2 O.
  ⑷S V1 O1 V2 O2?S V1 O1,O1 V2 O2.
  ⑸S V1 O1 V2 O2?S V1(O1 V2 O2).
  由此,可以比较容易地得出三句的句法树结构:
  (3) 连动句 (4) 兼语句
  


  
  4.结语
  
  在MT语言处理过程中,对原语的变换分析可以把复杂长句的句法分析和逻辑语义分析充分地结合起来,变换规则库的嵌入,对目标语的生成在句式的选择上、歧义分化翻译,以及篇章一致基础上的语用选择上,都提供了手段与可供选择的基础。虽然,机器的自然语言理解还处于不尽如人意的阶段,变换规则库的使用条件与完善,都有待进一步地细化与研究,但是变换分析在机器翻译中所能起到的积极意义是值得进一步探索的。
  
  参考文献:
  [1]陈昌来.现代汉语句子[M].华东师范大学出版社,2000.
  [2]王祁.格语法在英汉机器翻译系统中的应用研究[J].东北大学学报,2005,(11).
  [3]刘倬、傅爱平.机器翻译中汉语的形式和语义分析二题[J].中文信息学报,第13卷第5期.
  [4]曹翔.汉语语法变换分析与变换类型研究述评[J].河海大学学报,第5卷第3期.
  
  (李培培,河北大学人文学院)
其他文献
三年前的七月是一个多难的七月,继李公朴、闻一多二先生在昆明被害后,人民教育家陶行知先生又于二十五日患脑充血逝世。陶先生一生为劳苦大众教育及民主实践而奋斗,他不断的
《重庆陶研文史》是重庆市陶研会文史委员会与重庆育才中学主办的陶研季刊。今年是重庆育才中学建校80周年,为了表达我的衷心祝贺,特抒发两点感言。一、传承育才精神据我所知
本文对某车载雷达整车在运输状态和工作状态的稳定性进行了设计分析,并给出了详细的设计过程和计算结果。
在叙述锁相环基本原理的基础上,介绍了一种基于ADF4106的S波段雷达频率合成器的设计方法及测试结果,为高频频率合成器的设计提供了很好的思路。
本文主要介绍了语音编码算法G.729.A的原理,实现该算法的硬件平台和软件设计,以及提高G.729.A编码器的运行速度的优化方法和编程技巧。
本文对目标运动航迹模型、如何产生航迹模型数据,以及如何利用产生的目标运动航迹模型数据对雷达火控系统解算精度进行模拟分析的基本方法和步骤作了初步的探讨,以期使用较简单
“预设”是指人们在运用自然语言进行交际的过程中对某些隐含着的语境因素所作出的设定。文章以现代汉语为对象,着重探讨“才”“白”“都”三个预设触发词所触发的预设,从总体
陶行知先生对我青年时期的教育,影响深远。先生对我们的关怀和帮助,使我终生难忘。他坚定了我做教师工作的信念,他使我懂得了教育是为最大多数不幸的人之觉醒服务的,是为中华
期刊
摘 要:本文就仝国斌先生关于动量词“回”与“次”的差异问题提出一些异议。我们认为:一、早在唐宋时期,动量词“回”与“次”就是一对近义词;二、强调[+过程]是古汉语“回”的功能之一,这种用法在现代汉语某些方言中得以保留了下来;三、现代汉语共同语中“回”与“次”在称量对象方面没有什么差异,二者的差异主要体现在语用方面。  关键词:“回” “次” “差异”    《郑州大学学报》(哲社版)2007年第3