论文部分内容阅读
自然语言理解是人工智能领域的一个重要的研究问题,其最终目标是让机器真正理解人类语言,实现人机之间的无障碍勾通。由于自然语言存在约定、多值、缩略、隐含、隐喻等特点,使得计算机深入理解自然语言十分困难。长期以来自然语言理解问题一直没有被妥善解决,其根本原因是在计算机理解自然语言的过程中缺乏知识结构的支撑。本体作为一种知识表示方式,对同一领域中的概念及概念间的关系给出明确的形式化定义,支持知识的共享和复用。本文以本体论为基础,从常识知识的角度出发,研究自然语言分析过程中所需要的知识以及获取这些知识的方法。本文取得了以下研究成果:1.提出了一种事件的知识表示模型。本文以鲁川的现代汉语基本句模为基础,将一个句模看作一个事件,在事件语言表示模型的基础上提出事件的知识表示模型,将事件表示为E=(C W,L,P,LCS,PK,EK,R)七元组,即事件=(中枢词类,语言表示,谓词表示,LCS对应,前提知识,后果知识,角色细化)。事件的知识表示模型在包含事件语言层面内容的基础上添加了理解事件所需的前提和后果知识。可以用于事件的理解和推理。2.提出了一种事件知识分析的方法。事件知识作为一种常识性知识其获取仍然是知识获取的瓶颈。这里提出一种事件知识分析方法,从多个视角分析事件的前提和后果知识。在对事件知识分析中遵循基础分析、丰富知识、知识优化的流程。针对分析过程中所得知识难以全面和准确的问题,总结得出了生理、心理、社会、物理世界四个常识知识分析角度,同时在丰富知识步骤中提出了角色细化的方法。实验表明此方法能够得到较为全面和准确的事件知识。3.实现了一个本体管理工具。应用本工具知识工程师可以对事件的知识进行编辑和评价,同时能够方便地修改事件的层次结构。为了保证知识库的安全性设置了不同的用户权限,以限定不同级别的用户可以进行的操作。