面向语义选择限制的汉语动词语义知识表示研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:lok119119119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语动词的语义知识表示是语言知识工程领域的重要问题。在涉及句子语义分析和生成的各种NLP应用需求中,动词与名词概念之间的语义选择限制往往构成其中最核心和关键的凭据,截止目前,国内外针对这方面的研究和开发还不多见。本文从面向语义选择限制的角度,对动词语义知识表示的方法进行了探索,包括:基于新的层次分类的方法、基于及物性和论元结构实例知识的方法,评估了它们服务于特定目标的状况并取得了积极的进展。  在知识表示方面,一、受面向对象方法和生成词库理论的启发,基于层次分类的方法以名词概念体系为依托,试图将动词概念绑定到“对应”的名词概念上,从而形成了一种新的动词层次分类。在此基础上,进一步对分类体系进行了结构调整和优化,发展了同层子类之间的横向序关系,泛化、扩展了动词语义选择限制的理性知识;二、受现有语义知识库和语料库方法的启发,基于及物性和论元结构实例知识的方法从现有动词资源中提取及物性知识,从语料的依存分析结果中提取动词论元结构的实例知识,形成了动词语义选择限制的经验知识。在此基础上,借助词义相似度计算的手段,在适用范围上将经验知识进行了推广。以上两类方法分别采用分类描述、属性描述的形式,从知识工程的角度,本文分析了这两种描述形式的特点,提出了不同描述形式相互转换的可能性,以期获得更加简洁、一致的描述形式,进而促进语言知识的加工和应用。  在上述两类知识表示模型下,本文将获取的动词语义知识应用到实际的语义选择限制任务当中并做验证。北京大学《现代汉语语义词典》对动词论元语义类的描述是现有语言资源中较有代表性的,以它为基础的语义选择限制的正例识别率、负例误判率分别为52.0%、13.7%,其它方法的实现未见报道,这也是迄今为止所能得到的基线标准(baseline)。本文基于新的层次分类的方法取得了62.2%的正例识别率和13.8%的负例误判率,基于及物性和论元结构实例知识的方法取得了93.9%的正例识别率和6.2%的负例误判率。在此基础上,从两类知识融合的角度,本文也探讨了语义选择限制计算模型进一步优化的可能性。  实验表明,本文的动词语义知识表示方法、计算模型显著提升了语义选择限制任务的指标和性能。在未来,期望将其应用到更多的语义计算任务中去,促进动词语义知识表示方法、计算模型的不断完善和发展。
其他文献
在Internet飞速发展的今天,各种网络应用逐渐地融入了我们的生活,如www、ftp、email等已成为必不可少的服务,网络的流量也呈爆炸式的增长。当越来越多的人体会到这一技术所带来
在Tecton语言对面向概念的构件进行形式化规范的基础上,我们创建了Violet验证系统对构件的性质进行自动验证.Violet系统是基于重写技术的验证工具,其主要目的是辅助用户发现
视频监控下的人群密度估计及运动轨迹检测是可视化监控和人群管理的重要组成部分,广泛应用于公共场所的安全监控、智能人力管理以及道路交通管理等领域,是计算机视觉领域的重
Web性能测试方面的研究工作已经开展几年了,并取得了可喜成果.该文在这些工作的基础上,对Web性能测试做了进一步的研究,得出一些有益的结论,并开发了一个测试工具WebMark.第
本文针对中小型物流企业在现代物流竞争中的劣势,以沈阳市的物流环境为背景,研究了虚拟物流技术在解决这一问题中的可行性,并提出了构建基于J2EE技术的虚拟物流信息平台.文章
分布式对象计算技术是分布计算和面向对象技术相结合的产物,它的出现为网络计算平台上的软件开发提供了强有力的解决方案.目前,分布式对象技术已经成为建立服务端应用框架和
该文将研究的重点放在了Linux设备驱动程序的设计上.文章首先介绍了嵌入式系统、嵌入式Linux系统及其优点.然后详细介绍了Linux设备驱动程序的设计原理以及设计方法.之后该文
动态对等通信(dynamic peer communication)是目前最复杂的一种群组通信方式.该文简要分析了近几年提出的适合这种通信方式的五种组密钥协商协议,即CKD(Centralized Key Dist
神经网络自开创以来一直深受各国专家学者的重视,日渐成为一种重要的处理非线性问题的工具,被广泛应用于各种领域并取得了辉煌的成就.股票市场是经济的晴雨表和报警器,其作用
在工业界,大多数的硬件设计验证都是采用基于RTL级或者门级的逻辑模拟验证的方法.传统的逻辑模拟验证方法的优点在于它的准确性,而它的缺点在于随着系统的增大,输入的测试用