论文部分内容阅读
浩瀚无垠的世界知识如何形式化表述并有效地提供给计算机使用,这一问题一直是中文信息处理研究中需要从哲学角度深刻思考的问题。自然语言处理从语句一级的分析处理进入句群一级的分析处理阶段以后,这一问题又面临着新的挑战,句群的处理不同于一般语句的处理,计算机需要用针对性更强的世界知识来进行辅助性处理。HNC理论把这一知识按领域进行了分类,认为不同的领域具有不同的领域世界知识,在此前提下对每一领域赋予了领域句类表示式,通过领域句类表示式建立领域世界知识的形式化知识库,提前装入计算机中,在进行句群的处理时供计算机使用。本文在HNC理论的语境单元萃取相关原则的指导下,以国家治理与管理(节点a12)领域为例,首先通过概念节点的设计归纳得到该领域世界知识,然后先验设计与之对应的领域句类表示式,完成该领域句类知识的形式化表述工作,最后以两段具体句群为例,具体阐述如何实现这一形式化过程。