自然语言中副语言的逻辑处理

来源 :现代语文(语言研究) | 被引量 : 0次 | 上传用户:askloopp1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  毋庸质疑,语言交际都遵循“信息编码→信号→传递→接收→信息解码”的通讯模式。在这五个环节当中,作为终极端的“信息解码”其结果并不是由显性的语符唯一决定的,而是由“信息解码”,者(受话者)根据自己的经验、理解力、社会共有知识等诸多因素对接收到的信息进行分析重构而最终确定的。从某种意义上说,社会共有知识在从“信息入码”到“信息解码”的过程中起着最为关键的作用。因为在语言交际的过程中,作为信号发出者的说话者往往并不是单纯地要表达显性语符的静态意义,为此,作为信号接收者的受话者要准确理解说话者的交际意图就必须调动自己大脑中的社会共有知识去进行一系列的推断。当然,作为信号接收者的受话者只要一有接收信号的讯息,其社会共有知识便会被自动激活而参与到语言的再生成和解释活动中去。因此,语言就交际的目的而言在量的方面常常是不足的。要使我们的语言交际达到预先特定的交际效果就必须要靠显性的语符和隐性的“超语符”的合力运作。这个隐性的“超语符”也就是我们所说的副语言(paralanguage)。Mehrabian&Ferris甚至认为,交际过程中词句只承担了7﹪的信息量。
  就语言交际的整个过程而言,“人(说话者)→人(受话者)”模式在正常情况下是不存在任何问题的,但对于“人→机→人”模式,情况就复杂得多了。同计算机“对话”实质上就是从功能上模拟人与人之间的语言交际。当计算机接收说话者所发出的言语信息时(这个过程形式上是静态的、固定不变的,但这里是从功能上模拟人与人之间的语言交际的动态意义上讲的。),它模拟的是人的耳→脑感知系统接收语音信息的过程。这一过程是智能化的自动言语识别(antomatic speech recognition,简称ASR)。反过来,当我们把计算机用来当作言语输出装置时,它实质上模拟的是作为信号发出者的说话者。这一过程乃是将特定的语符转换成连续的有一定节律的声学信号的智能过程。人们通常把这个过程叫作言语生成。在上述两个过程中,虽然我们用计算机从功能上去模拟人,但计算机终究还是代替不了人。因为,计算机的反应机制必须依靠预先确定好了的语言形式。“词”曾经号称计算机信息处理的“拦路虎”,但笔者以为当下甚至未来很长一段时间内真正意义上的“拦路虎”还是副语言。因为计算机根本不具备受话者个体所具有的经验、理解力、社会共有知识等,它只能执行固定的、程序化的指令。但这同时也向我们表明了:只要我们将副语言转换成一种计算机可以识别的代码,问题也就迎刃而解了。本文就拟用逻辑的工具处理自然语言中的副语言现象,以期为COLING特别是为解决自然语言的识别问题(人机对话)提供些许借鉴。当然,副语言包括有声副语言和无声副语言,无声副语言主要指以一个动作或者一个行为传递某种信息的手势语、体态语等。由于不同的文化背景,无声副语言便具有不同的特定的涵义,所以这里仅限于对有声副语言的处理。
  同一语言形式如果我们用不同的语气、语调表达出来,其意义则会大不相同。在语言交际的过程中,只要我们充分调动自己以知识结构形式储存在大脑中的经验、理解力、社会共有知识诸因素,理解对方的意图应该是不成问题的。但是,这种情况对计算机来说就不是那么轻而易举的事情了。对计算机而言,“自然语言处理系统只能首先从语言的句法方面入手,进而深入到语义层次。”我们不妨相互比较地看看以下一些例子:
  (1)大家都喜欢小王。
  说话者直截了当地陈述一个事实。对其进行句法分析的结果如下 *:
  


  通过上述句法分析,我们便得到了(1)的量化公式:(所有,都)(人,小王,喜欢)(在FC系统中,这一量化公式作(所有dou)(人,小王,喜欢)处理)。如果我们以“‖S‖=1”表示语句S的语义赋值为真,以“Q”表示量词,以“A”表示“人”,以“B”表示“小王”,以“C”表示不定指的某一个人,以“R”表示“喜欢”,我们便又可以得到(1)的语义解释:‖S(1)‖=1iff‖Q(所有)(A,B)(R)‖=1。
  (2) 大家都喜欢小王?
  说话者对话语中的“小王”既重读,语调上又用升调,从而表达了对大家喜欢的对象“小王”表示怀疑的内涵。言外之意,该话语实际上暗含了三层含义:第一层含义是大家都喜欢某一个人;第二层含义是有些人认为这个人就是小王;第三层含义是说话者并不这么认为。所以,该语句的句法分析如下:
  


  显然,‖S(2)‖=1iff‖Q( 所有)(A,C)(R)‖=1&‖Q(有些)(A,B)(R)‖=1&‖Q(有些)(A,B)(?R)‖=1。
  (3) 大家都喜欢小王?
  说话者重读话语中表全指的“都”,同时又延长“都”的语音,从而表达了说话者对喜欢小王的人的范围表示怀疑。于是,该语句的内涵就成了以下的两层含义的合取:第一层含义是有些人喜欢小王;第二层含义是这些人并不是全部。该语句的句法分析如下:
  


  和(2)相比较,我们得到‖S(3)‖=1iff‖Q(有些)(A,B)(R)‖=1&‖Q(有些)(A,B)(?R)‖=1。
  虽然(2)(3)都可以用如下句法分析树来表示(右上图),但却不能精确地表达说话者的意图。
  (4)大家都喜欢小王!
  


  说话者重读整个语句并在“都”和“喜欢”后稍停顿,语调上用降调,从而表达了对(2)(3)的回击。其句法分析则是(右中图):
  同(1)相比,(4)只是表示强调而已,所以,‖S(4)‖=1iff‖Q(所有)(A,B)(R)‖=1。
  (5)大家都喜欢小王!
  说话者用一种特殊的语调表达了和话语“唷,现在大家都喜欢小王了嗦!”相同的内涵,从而表达了一种惊讶。(上图)和前面几个话语相比,(5)的句法分析稍显复杂一些,因为要准确把握(5)所传递的信息,存在一个时段的问题。
  相应的,‖S(5)‖=1iff {‖Q(有些)(A,B)(?R)‖=1?‖过去‖}&{‖Q(所有)(A,B)(R)‖=1?‖现在‖}。
  由于副语言的存在,导致自然语言语句组合结构的意义未必就等于结构意义的组合,从而影响了自然语言语义分析的可计算性,而“自然语言理解的核心问题在于语义理解”。我们知道,自然语言的信息处理其基本思路是从一种语言到另一种语言,而后一种语言则是需要形式化的语言。“对自然语言作形式化处理,本身就是人工智能化的一个走向,它等同于用机器理解并翻译自然语言,使之转化为另一种语言。”要很好地完成从一种语言到另一种形式化语言的转换,就必须依赖于对所需处理的自然语言语义的准确把握。相对来说,其语义仅仅由显性的语言文字直接决定的自然语言语句处理起来就要容易得多。而对于含有副语言成分的语义相对复杂的自然语言语句来说处理起来就不是那么轻而易举的事情了。但是,通过上述句法分析的技术处理以后,问题又变得相对简单了。之后,我们就可以进入自然语言处理最关键的编码这一环节了,随之我们也就可以完成存储、编辑、输出和传输等环节的工作,从而也就可以完成自然语言信息处理的全部工作。由此看来,“自然语言的信息处理很大程度上依赖逻辑的先期工作。”而且,由于“不同的语言、文化之间存在着共同的结构”,这本身就为自然语言的“可计算”提供了可能,同时亦使本研究具有了一定程度上的普遍性。为此,亚洲自然语言处理联合会主席邹嘉彦(Benjamin K TSOU)教授2002年在一个专题座谈会上曾大胆地预言:五年后的中国,从语音到文本,从文本到语音的自由转换将成为计算机的一个基本特征。
  
  (秦玮远,四川绵阳师范学院)
其他文献
中国共产党一贯重视反腐倡廉工作,十分重视提高人民满意度,加强党员纯洁性。中共十八大在党的廉政建设与反腐败的工程部署上,提出党内要加强思想建设、组织建设、作风建设、反腐
关于传说我不想深究只知道在历史上你有很重的一笔
做好扩大农村金融改革试点工作,事关民生和经济社会发展的全局。2010年以来,广西贺州市八步区实行扩大农村金融改革试点,积极探索建立金融支持和服务“三农”的长效机制,推动农村
企业的竞争是人才的竞争,人力资源是企业的第一资源。如何有效激励员工,激发员工的工作积极性、主动性和创造性是人力资源管理者的责任和使命。现代企业人力资源管理更加注重“
摘 要:随着社会发展和国际交流的深入,字母词不断增多,研究字母词可以为语言规范和语言研究提供有价值的参考系数和材料。本文从字母词的界定入手,探讨了字母词的类型和产生的原因,分析了字母词的特点,并认为对待字母词应该持宽容的态度。  关键词:字母词 界定 类型 来源 应用    现代汉语中的字母词绝大部分是随着外来语的引进和汉语拼音方案的广泛应用即出现的。研究字母词有助于促进共时语言学的发展,有利于汉
口头语言是人们交流思想的主要工具,其使用范围比书面语言更广、频率更高,在学习、生活和工作尤其是人际交往中都极为重要。同时,从思维到口头表达,不仅需要对思维进行重新组织、加工、提炼,也是学生自信心和对思维驾控能力的综合体现,这本身是一个极为复杂的再加工、再复制过程。口头表达能力好的学生,往往思维缜密,反应灵敏,思路开阔,同时具备较好的文字表达能力。口头表达能力提高了,思维能力和文字表达能力也会有所提
思维与语言的关系是一个争论已久的老问题。以柏拉图为代表的“等同论”者认为,思维与语言原本就是同一个东西,思维如同一种会话,言语是出声的思维,思维是无声的言语。这种把思维与语言看作同一个东西的观点虽然历史久远,但却不符合人们所体念到的事实,因而被人抛弃了。人们逐渐意识到思维与语言是两个不同的东西。然而,由于两者联系过于紧密,以至于难以认清其中的关系,由此“语言决定论”兴盛起来。斯大林可以说是“语言决
从1919年废除文言文的白话文运动至今已历时90周年。用了几千年的文言文为什么突然要废除呢?为什么废除90年以后还有人舍不得呢?到底应该怎样对待文言文的历史和未来、文言文和
山东能源新矿集团鄂庄煤矿地下煤层气化炉因井下煤层炉壁开裂,从煤岩层裂隙泄漏出的CO浓度高达1000PPm,温度710℃,喷出压力达到2160Pa。为避免泄漏的有害气体波及采区,采用井下风
近年来,我国店名语言出现了愈演愈烈的恶俗化倾向,形成原因涉及政治、经济、文化、历史、民族心态等多种因素。店名恶俗化倾向表面上是语言病害,实质上是文化遭受污染的直观显现