论文部分内容阅读
语义计算(或意义计算)是自然语言处理和人工智能领域一个核心课题,该研究成果可以广泛应用到文本挖掘、信息搜索、机器翻译、人机交互等领域。在计算主义框架下,语义计算可以看成是计算机对自然语言语义的理解。一方面,语言哲学、语义学等学科需要为语义计算提供具有可操作性的语义理论,另一方面计算机学科需要根据语义理论进行形式化处理以便实现语义计算。正是这两方面要求形成了一个矛盾,即意义和计算的矛盾。可计算理论认为所有可计算的函数都是通过符号串的变换来实现其计算过程的,即计算就是符号的变换。在这个思想的指导下,语义理论需要给出对自然语言表达式意义的形式化表征,给出具有形式化规则的意义概念,这一点逻辑语义学可以保证。围绕意义和计算之间潜存的不融贯特性,如果语义计算可行,那么它做出了一系列的哲学预设,包括:真值条件语义学的意义观点、意义组合性原则、世界(或语境)的形式化表征。其中真值条件语义学提供了对每一句自然语言表达式的意义;意义组合原则解释了语言的可学习性和可理解性;世界的形式化表征则将语义值赋予自然语言表达式。但是自然语言语义远比真值条件复杂,而且这二大工作假设并非那么合理,甚至是特设性假设。句子的真值条件仅仅是其意义的一部分,而且在真实交流中,存在大量没有真值但却有意义的句子,这类句子是完成行为式表达式,是一种言语行为。这种完成行为式没有所谓的真值条件,因为这些句子不在于描述某个事件,而在完成一件事情。所以计算机要理解自然语言,必须要能理解这种言语行为表达式。言语行为是一种受规则支配的行为,如构成规则和调节规则,而且对言语行为意义的理解和说话人的意图、言语行为发生的语境关系非常密切。所以计算机必须能够形式化地表征这些规则、意图和语境。但是一切知识都可以以命题的形式,甚至可以形式化的形式表达,这一认识论假设在实际操作中,特别是在形式化构造模型或语境时,并不能唯一确定语言的意义。因为规则、语境或世界以一种整体样式被我们所理解,这和计算机以离散的、孤立的数据处理对象的本质要求不相符合。塞尔借助“中文屋”实验反驳了计算机理解自然语言的可能性,认为理解并非是句法演算过程,而是由意向性所保证的。有学者给出了意向性的计算主义解释,认为有选择的表征和模型构建可以模拟心灵的意向性状态。但是两个条件无法真正实现系统的意向性,作为生物所共有的深层背景和人类独有的局部文化实践同样以整体样式呈现出来。本文并不敢妄下结论认为语义计算是不可实现的,仅仅想表明要实现语义计算所面临的困难。但有一点我们是确定的,即不能用微世界(mircoworld)理论的简单推广,或者用物理学借助理想实验的成功的模式来处理我们对语言的理解。