基于FrameNet框架关系的文本蕴含识别研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:galahad55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本蕴含识别是处理自然语言中广泛存在的同义异形现象的一种有效途径,在自然语言处理领域中占有基础而又重要的地位。提高文本蕴含识别的性能对于提高信息检索、信息抽取、自动问答、文本摘要等系统的效率起到重要作用。FrameNet知识资源是一个具有丰富语义信息的词汇资源,在词汇资源中占有重要地位,目前已被广泛应用于自然语言处理领域,如语义推理、本体构建、句子相似度计算等。本文将框架语义学的相关理论知识应用于文本蕴含识别系统中,并分析了语义知识资源FrameNet对文本蕴含识别性能的影响,进一步探索了利用FrameNet框架关系进行语义推理的方式方法。本文在分析了国内外文本蕴含识别研究现状的基础上,以FrameNet词汇知识资源为基础,提出了一种利用FrameNet框架及其框架关系建立文本蕴含模型来识别文本蕴含的方法。本文以框架语义学为理论依据,深入研究FrameNet资源中的框架、框架关系以及框架元素等,确定FrameNet资源中可用于文本蕴含识别的知识,然后将这些知识进行形式化描述,构建框架蕴含关系图,并按照框架关系建立框架元素之间的映射。论文依据FrameNet词汇资源,结合框架蕴含关系图以及框架元素之间的映射关系,在给定文本T和假设H中目标词激起的框架基础上,利用深度优先搜索,在框架蕴含关系图中,查询T和H中框架之间的上下位关系;再使用词汇对比和词汇资源WordNet及其语义关系判断具有映射关系的框架元素的填充词是否一致或相似,从框架和框架元素两个层面实现文本蕴含识别。论文利用FrameNet词汇资源在第三届文本蕴含识别评测(RTE-3)语料上进行了实验,采用本文的方法进行文本蕴含识别的准确率和召回率分别为77.06%和56.13%,其中准确率仅低于第三届文本蕴含识别评测的最优结果。
其他文献
本文从如何在面向对象软件工程方法中用规范的形式表达界面的逻辑构成这一核心问题出发,探讨了FMP界面模型中交互模型的概念.它借用了UML中交互模型的概念,类似于合作模型,并
在演绎数据库领域中,魔集转换是一种自顶向下和自底向上相结合的计算策略,它使逻辑程序的计算始终限制在与查询相关的数据中。但是随着递归IDB(Intensional Database)谓词的项
通过因特网对现场或存储的视频进行实时传输是流媒体的主要内容之一。然而,由于当前因特网具有尽力而为的特性,它不为视频流提供任何的服务质量保证。此外,因特网的异构性使得它
近年来,随着互联网的普及,VOD(视频点播)作为一种视音频媒体传输的典型应用,受到人们的关注。VOD技术是计算机技术、网络通信技术、多媒体技术和数字压缩技术多学科、多领域交叉
该文就目前信息化浪潮下,结合目前校园网优化构建的迫切性,对现代网络交换技术进行探讨,运用第三层交换技术到校园网组建中,并给出了具体的实施案例.作者首先对目前的网络交
当今社会已进入了信息时代,随着计算机应用领域的扩大及信息处理技术与通讯技术的发展与结合,企业信息化正逐步深入各行各业。企业面临激烈的外部市场竞争和企业内部流程重组
工作强度增加、工作时间延长、精神压力增大等诸多因素都会导致出现疲劳感。在疲劳状态下工作效率低,易引发安全事故,会给身体带来多种疾病。对人体疲劳状态进行实时检测越来
本文首先介绍了国内外相关研究的现状,阐述了本课题的研究意义以及研究内容.接下来探讨了敏捷供应链的发展背景、相关概念及管理模型.深入研究了Agent技术的基本原理,分析了K
在电子技术高速发展的今天,新电路、新器件不断涌现,由于实验室受条件的限制,无法及时满足各种电路的设计和实验要求,因此采用软件仿真的方法,在计算机上虚拟出一个测试仪器
利用局域网接入Internet时,Internet服务提供商会向局域网用户收取一定的费用.为了使局域网用户公平分担这些费用,需要引入一个网络计费系统,对用户使用网络资源的情况进行计