论文部分内容阅读
汉语动词的语义知识表示是语言知识工程领域的重要问题。在涉及句子语义分析和生成的各种NLP应用需求中,动词与名词概念之间的语义选择限制往往构成其中最核心和关键的凭据,截止目前,国内外针对这方面的研究和开发还不多见。本文从面向语义选择限制的角度,对动词语义知识表示的方法进行了探索,包括:基于新的层次分类的方法、基于及物性和论元结构实例知识的方法,评估了它们服务于特定目标的状况并取得了积极的进展。 在知识表示方面,一、受面向对象方法和生成词库理论的启发,基于层次分类的方法以名词概念体系为依托,试图将动词概念绑定到“对应”的名词概念上,从而形成了一种新的动词层次分类。在此基础上,进一步对分类体系进行了结构调整和优化,发展了同层子类之间的横向序关系,泛化、扩展了动词语义选择限制的理性知识;二、受现有语义知识库和语料库方法的启发,基于及物性和论元结构实例知识的方法从现有动词资源中提取及物性知识,从语料的依存分析结果中提取动词论元结构的实例知识,形成了动词语义选择限制的经验知识。在此基础上,借助词义相似度计算的手段,在适用范围上将经验知识进行了推广。以上两类方法分别采用分类描述、属性描述的形式,从知识工程的角度,本文分析了这两种描述形式的特点,提出了不同描述形式相互转换的可能性,以期获得更加简洁、一致的描述形式,进而促进语言知识的加工和应用。 在上述两类知识表示模型下,本文将获取的动词语义知识应用到实际的语义选择限制任务当中并做验证。北京大学《现代汉语语义词典》对动词论元语义类的描述是现有语言资源中较有代表性的,以它为基础的语义选择限制的正例识别率、负例误判率分别为52.0%、13.7%,其它方法的实现未见报道,这也是迄今为止所能得到的基线标准(baseline)。本文基于新的层次分类的方法取得了62.2%的正例识别率和13.8%的负例误判率,基于及物性和论元结构实例知识的方法取得了93.9%的正例识别率和6.2%的负例误判率。在此基础上,从两类知识融合的角度,本文也探讨了语义选择限制计算模型进一步优化的可能性。 实验表明,本文的动词语义知识表示方法、计算模型显著提升了语义选择限制任务的指标和性能。在未来,期望将其应用到更多的语义计算任务中去,促进动词语义知识表示方法、计算模型的不断完善和发展。