论文部分内容阅读
毋庸质疑,语言交际都遵循“信息编码→信号→传递→接收→信息解码”的通讯模式。在这五个环节当中,作为终极端的“信息解码”其结果并不是由显性的语符唯一决定的,而是由“信息解码”,者(受话者)根据自己的经验、理解力、社会共有知识等诸多因素对接收到的信息进行分析重构而最终确定的。从某种意义上说,社会共有知识在从“信息入码”到“信息解码”的过程中起着最为关键的作用。因为在语言交际的过程中,作为信号发出者的说话者往往并不是单纯地要表达显性语符的静态意义,为此,作为信号接收者的受话者要准确理解说话者的交际意图就必须调动自己大脑中的社会共有知识去进行一系列的推断。当然,作为信号接收者的受话者只要一有接收信号的讯息,其社会共有知识便会被自动激活而参与到语言的再生成和解释活动中去。因此,语言就交际的目的而言在量的方面常常是不足的。要使我们的语言交际达到预先特定的交际效果就必须要靠显性的语符和隐性的“超语符”的合力运作。这个隐性的“超语符”也就是我们所说的副语言(paralanguage)。Mehrabian&Ferris甚至认为,交际过程中词句只承担了7﹪的信息量。
就语言交际的整个过程而言,“人(说话者)→人(受话者)”模式在正常情况下是不存在任何问题的,但对于“人→机→人”模式,情况就复杂得多了。同计算机“对话”实质上就是从功能上模拟人与人之间的语言交际。当计算机接收说话者所发出的言语信息时(这个过程形式上是静态的、固定不变的,但这里是从功能上模拟人与人之间的语言交际的动态意义上讲的。),它模拟的是人的耳→脑感知系统接收语音信息的过程。这一过程是智能化的自动言语识别(antomatic speech recognition,简称ASR)。反过来,当我们把计算机用来当作言语输出装置时,它实质上模拟的是作为信号发出者的说话者。这一过程乃是将特定的语符转换成连续的有一定节律的声学信号的智能过程。人们通常把这个过程叫作言语生成。在上述两个过程中,虽然我们用计算机从功能上去模拟人,但计算机终究还是代替不了人。因为,计算机的反应机制必须依靠预先确定好了的语言形式。“词”曾经号称计算机信息处理的“拦路虎”,但笔者以为当下甚至未来很长一段时间内真正意义上的“拦路虎”还是副语言。因为计算机根本不具备受话者个体所具有的经验、理解力、社会共有知识等,它只能执行固定的、程序化的指令。但这同时也向我们表明了:只要我们将副语言转换成一种计算机可以识别的代码,问题也就迎刃而解了。本文就拟用逻辑的工具处理自然语言中的副语言现象,以期为COLING特别是为解决自然语言的识别问题(人机对话)提供些许借鉴。当然,副语言包括有声副语言和无声副语言,无声副语言主要指以一个动作或者一个行为传递某种信息的手势语、体态语等。由于不同的文化背景,无声副语言便具有不同的特定的涵义,所以这里仅限于对有声副语言的处理。
同一语言形式如果我们用不同的语气、语调表达出来,其意义则会大不相同。在语言交际的过程中,只要我们充分调动自己以知识结构形式储存在大脑中的经验、理解力、社会共有知识诸因素,理解对方的意图应该是不成问题的。但是,这种情况对计算机来说就不是那么轻而易举的事情了。对计算机而言,“自然语言处理系统只能首先从语言的句法方面入手,进而深入到语义层次。”我们不妨相互比较地看看以下一些例子:
(1)大家都喜欢小王。
说话者直截了当地陈述一个事实。对其进行句法分析的结果如下 *:

通过上述句法分析,我们便得到了(1)的量化公式:(所有,都)(人,小王,喜欢)(在FC系统中,这一量化公式作(所有dou)(人,小王,喜欢)处理)。如果我们以“‖S‖=1”表示语句S的语义赋值为真,以“Q”表示量词,以“A”表示“人”,以“B”表示“小王”,以“C”表示不定指的某一个人,以“R”表示“喜欢”,我们便又可以得到(1)的语义解释:‖S(1)‖=1iff‖Q(所有)(A,B)(R)‖=1。
(2) 大家都喜欢小王?
说话者对话语中的“小王”既重读,语调上又用升调,从而表达了对大家喜欢的对象“小王”表示怀疑的内涵。言外之意,该话语实际上暗含了三层含义:第一层含义是大家都喜欢某一个人;第二层含义是有些人认为这个人就是小王;第三层含义是说话者并不这么认为。所以,该语句的句法分析如下:

显然,‖S(2)‖=1iff‖Q( 所有)(A,C)(R)‖=1&‖Q(有些)(A,B)(R)‖=1&‖Q(有些)(A,B)(?R)‖=1。
(3) 大家都喜欢小王?
说话者重读话语中表全指的“都”,同时又延长“都”的语音,从而表达了说话者对喜欢小王的人的范围表示怀疑。于是,该语句的内涵就成了以下的两层含义的合取:第一层含义是有些人喜欢小王;第二层含义是这些人并不是全部。该语句的句法分析如下:

和(2)相比较,我们得到‖S(3)‖=1iff‖Q(有些)(A,B)(R)‖=1&‖Q(有些)(A,B)(?R)‖=1。
虽然(2)(3)都可以用如下句法分析树来表示(右上图),但却不能精确地表达说话者的意图。
(4)大家都喜欢小王!

说话者重读整个语句并在“都”和“喜欢”后稍停顿,语调上用降调,从而表达了对(2)(3)的回击。其句法分析则是(右中图):
同(1)相比,(4)只是表示强调而已,所以,‖S(4)‖=1iff‖Q(所有)(A,B)(R)‖=1。
(5)大家都喜欢小王!
说话者用一种特殊的语调表达了和话语“唷,现在大家都喜欢小王了嗦!”相同的内涵,从而表达了一种惊讶。(上图)和前面几个话语相比,(5)的句法分析稍显复杂一些,因为要准确把握(5)所传递的信息,存在一个时段的问题。
相应的,‖S(5)‖=1iff {‖Q(有些)(A,B)(?R)‖=1?‖过去‖}&{‖Q(所有)(A,B)(R)‖=1?‖现在‖}。
由于副语言的存在,导致自然语言语句组合结构的意义未必就等于结构意义的组合,从而影响了自然语言语义分析的可计算性,而“自然语言理解的核心问题在于语义理解”。我们知道,自然语言的信息处理其基本思路是从一种语言到另一种语言,而后一种语言则是需要形式化的语言。“对自然语言作形式化处理,本身就是人工智能化的一个走向,它等同于用机器理解并翻译自然语言,使之转化为另一种语言。”要很好地完成从一种语言到另一种形式化语言的转换,就必须依赖于对所需处理的自然语言语义的准确把握。相对来说,其语义仅仅由显性的语言文字直接决定的自然语言语句处理起来就要容易得多。而对于含有副语言成分的语义相对复杂的自然语言语句来说处理起来就不是那么轻而易举的事情了。但是,通过上述句法分析的技术处理以后,问题又变得相对简单了。之后,我们就可以进入自然语言处理最关键的编码这一环节了,随之我们也就可以完成存储、编辑、输出和传输等环节的工作,从而也就可以完成自然语言信息处理的全部工作。由此看来,“自然语言的信息处理很大程度上依赖逻辑的先期工作。”而且,由于“不同的语言、文化之间存在着共同的结构”,这本身就为自然语言的“可计算”提供了可能,同时亦使本研究具有了一定程度上的普遍性。为此,亚洲自然语言处理联合会主席邹嘉彦(Benjamin K TSOU)教授2002年在一个专题座谈会上曾大胆地预言:五年后的中国,从语音到文本,从文本到语音的自由转换将成为计算机的一个基本特征。
(秦玮远,四川绵阳师范学院)
就语言交际的整个过程而言,“人(说话者)→人(受话者)”模式在正常情况下是不存在任何问题的,但对于“人→机→人”模式,情况就复杂得多了。同计算机“对话”实质上就是从功能上模拟人与人之间的语言交际。当计算机接收说话者所发出的言语信息时(这个过程形式上是静态的、固定不变的,但这里是从功能上模拟人与人之间的语言交际的动态意义上讲的。),它模拟的是人的耳→脑感知系统接收语音信息的过程。这一过程是智能化的自动言语识别(antomatic speech recognition,简称ASR)。反过来,当我们把计算机用来当作言语输出装置时,它实质上模拟的是作为信号发出者的说话者。这一过程乃是将特定的语符转换成连续的有一定节律的声学信号的智能过程。人们通常把这个过程叫作言语生成。在上述两个过程中,虽然我们用计算机从功能上去模拟人,但计算机终究还是代替不了人。因为,计算机的反应机制必须依靠预先确定好了的语言形式。“词”曾经号称计算机信息处理的“拦路虎”,但笔者以为当下甚至未来很长一段时间内真正意义上的“拦路虎”还是副语言。因为计算机根本不具备受话者个体所具有的经验、理解力、社会共有知识等,它只能执行固定的、程序化的指令。但这同时也向我们表明了:只要我们将副语言转换成一种计算机可以识别的代码,问题也就迎刃而解了。本文就拟用逻辑的工具处理自然语言中的副语言现象,以期为COLING特别是为解决自然语言的识别问题(人机对话)提供些许借鉴。当然,副语言包括有声副语言和无声副语言,无声副语言主要指以一个动作或者一个行为传递某种信息的手势语、体态语等。由于不同的文化背景,无声副语言便具有不同的特定的涵义,所以这里仅限于对有声副语言的处理。
同一语言形式如果我们用不同的语气、语调表达出来,其意义则会大不相同。在语言交际的过程中,只要我们充分调动自己以知识结构形式储存在大脑中的经验、理解力、社会共有知识诸因素,理解对方的意图应该是不成问题的。但是,这种情况对计算机来说就不是那么轻而易举的事情了。对计算机而言,“自然语言处理系统只能首先从语言的句法方面入手,进而深入到语义层次。”我们不妨相互比较地看看以下一些例子:
(1)大家都喜欢小王。
说话者直截了当地陈述一个事实。对其进行句法分析的结果如下 *:

通过上述句法分析,我们便得到了(1)的量化公式:(所有,都)(人,小王,喜欢)(在FC系统中,这一量化公式作(所有dou)(人,小王,喜欢)处理)。如果我们以“‖S‖=1”表示语句S的语义赋值为真,以“Q”表示量词,以“A”表示“人”,以“B”表示“小王”,以“C”表示不定指的某一个人,以“R”表示“喜欢”,我们便又可以得到(1)的语义解释:‖S(1)‖=1iff‖Q(所有)(A,B)(R)‖=1。
(2) 大家都喜欢小王?
说话者对话语中的“小王”既重读,语调上又用升调,从而表达了对大家喜欢的对象“小王”表示怀疑的内涵。言外之意,该话语实际上暗含了三层含义:第一层含义是大家都喜欢某一个人;第二层含义是有些人认为这个人就是小王;第三层含义是说话者并不这么认为。所以,该语句的句法分析如下:

显然,‖S(2)‖=1iff‖Q( 所有)(A,C)(R)‖=1&‖Q(有些)(A,B)(R)‖=1&‖Q(有些)(A,B)(?R)‖=1。
(3) 大家都喜欢小王?
说话者重读话语中表全指的“都”,同时又延长“都”的语音,从而表达了说话者对喜欢小王的人的范围表示怀疑。于是,该语句的内涵就成了以下的两层含义的合取:第一层含义是有些人喜欢小王;第二层含义是这些人并不是全部。该语句的句法分析如下:

和(2)相比较,我们得到‖S(3)‖=1iff‖Q(有些)(A,B)(R)‖=1&‖Q(有些)(A,B)(?R)‖=1。
虽然(2)(3)都可以用如下句法分析树来表示(右上图),但却不能精确地表达说话者的意图。
(4)大家都喜欢小王!

说话者重读整个语句并在“都”和“喜欢”后稍停顿,语调上用降调,从而表达了对(2)(3)的回击。其句法分析则是(右中图):
同(1)相比,(4)只是表示强调而已,所以,‖S(4)‖=1iff‖Q(所有)(A,B)(R)‖=1。
(5)大家都喜欢小王!
说话者用一种特殊的语调表达了和话语“唷,现在大家都喜欢小王了嗦!”相同的内涵,从而表达了一种惊讶。(上图)和前面几个话语相比,(5)的句法分析稍显复杂一些,因为要准确把握(5)所传递的信息,存在一个时段的问题。
相应的,‖S(5)‖=1iff {‖Q(有些)(A,B)(?R)‖=1?‖过去‖}&{‖Q(所有)(A,B)(R)‖=1?‖现在‖}。
由于副语言的存在,导致自然语言语句组合结构的意义未必就等于结构意义的组合,从而影响了自然语言语义分析的可计算性,而“自然语言理解的核心问题在于语义理解”。我们知道,自然语言的信息处理其基本思路是从一种语言到另一种语言,而后一种语言则是需要形式化的语言。“对自然语言作形式化处理,本身就是人工智能化的一个走向,它等同于用机器理解并翻译自然语言,使之转化为另一种语言。”要很好地完成从一种语言到另一种形式化语言的转换,就必须依赖于对所需处理的自然语言语义的准确把握。相对来说,其语义仅仅由显性的语言文字直接决定的自然语言语句处理起来就要容易得多。而对于含有副语言成分的语义相对复杂的自然语言语句来说处理起来就不是那么轻而易举的事情了。但是,通过上述句法分析的技术处理以后,问题又变得相对简单了。之后,我们就可以进入自然语言处理最关键的编码这一环节了,随之我们也就可以完成存储、编辑、输出和传输等环节的工作,从而也就可以完成自然语言信息处理的全部工作。由此看来,“自然语言的信息处理很大程度上依赖逻辑的先期工作。”而且,由于“不同的语言、文化之间存在着共同的结构”,这本身就为自然语言的“可计算”提供了可能,同时亦使本研究具有了一定程度上的普遍性。为此,亚洲自然语言处理联合会主席邹嘉彦(Benjamin K TSOU)教授2002年在一个专题座谈会上曾大胆地预言:五年后的中国,从语音到文本,从文本到语音的自由转换将成为计算机的一个基本特征。
(秦玮远,四川绵阳师范学院)