论文部分内容阅读
自然语言理解的研究目标就是让计算机理解人类的语言,然而,多年过去了,囿于传统语义理论的狭隘视角,自然语言理解研究仍然徘徊在语义的大门之外。其实,早在60多年以前,言语行为理论就已经提出言语的意义是由其行为而产生。“言语意图”就是行为视角下的语义,是更高层次的语义。本文从言语行为理论的视角深入地探讨了意图的哲学意义、语言学特征,以及如何让机器理解言语意图等一系列问题。本文从哲学的角度将言语意图进行了分类,这样做除了使我们看到了更深层的理解过程,还为言语的命题内容添加了世界标签,世界标签为进一步利用可能世界解释意图逻辑表征的语义奠定了基础。本文还对动词、粒词等进行了深入的研究,并依此对各类言语意图表述的句法特征进行了详细的刻画。这些句法特征是言语意图解析的基础。本文从动态的视角提出了理解是还原的过程,即:解析、推理和构建。对言语意图的解析,本文主要尝试了两种方法,一种是聚类的方法,另一种是结构解析的方法。在聚类的方法中,没有使用任何句法分析和词性标注技术,然而,基于聚类的语义角色标注结果与用其它方法获得的结果不相上下,平均正确率为83.8%。在结构分析的方法中,本文将框架语义理论和范畴语法相结合,并用类型特征结构表征纠缠的句法-语义关系,然后将语义层从中剥离出来,从而获得了言语意图的逻辑表征。该表征可以大大降低计算机处理的负担。句法-语义接口问题一直是语义理论中的难题。本文的“语义层剥离’技术将可能为自然语言处理提供一个新的思路。对推理环节,本文提出了基于关系的推理,并论证了这样的系统具有一定的容错度。对理解中的构建环节,本文探讨了言语行为和普通行为之间的关系以及时间推理问题。本文提出言语行为和普通行为在逻辑表征方面是一致的,但是,言语所描述的事件的结构是言语的表述结构,它和我们的知识中的事件的结构是不对等的。言语为我们理解其所描述的事件提供信息,反过来,经验为我们理解言语提供依据。本文提出了基于模式的时间推理,其平均复杂度为O(nlogn)+O(n),小于以往以段表征的方法。由于认识和技术的局限,本文没有探讨言语意图可能涉及的情境、情感等问题。