有定的零形式识别技术研究

来源 :山西大学 | 被引量 : 4次 | 上传用户:jj2653026
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义角色标注(Semantic Role Labeling)近来年来备受关注,且已取得了长足的发展,多项研究表自动推断语义论元结构能够导致诸如信息抽取、自动问答和文本蕴含等众多自然语言处理(Natural Language Processing)应用领域性能的实质提高。然而,由于传统上SRL只是作为句子内部的角色标注任务而没有扩展到篇章级别,同时只是给显现表达的句法论元标注语义角色,从而丢失了许多未显现表达的语义角色,这些角色中有一部分在联系篇章中各个局部语义论元之间的关系时起到至关重要的作用,由于这些缺失,也使得局部语义论元之间的这些关系被忽略了。因此,发现这些缺失的语义角色对于推动篇章理解具有特别积极的意义。在FrameNet中,这些缺失的语义角色被称为是零形式框架元素(Null Instantiation),简称为零形式,其中那些能够在局部语义论元之间建立起语义联系的零形式被称为有定的零形式框架元素(Definite Null Instantiation),也简称为有定的零形式。在FrameNet中,通过抽取句子的核心依存图可以发现其所在篇章段落的语义线索,而推导核心依存图中有一个关键问题——缺位填充,所谓缺位填充就是识别出结构中有定的零形式的显示先行成分。本文从SemEval-2010Task10的NI Task任务出发,研究语料中有定的零形式的识别方法,提出一个二级流水线的识别模型:第一级使用基于规则的方法在语义角色标注的语料基础上检测出其中的零形式;第二级使用最大熵分类器预测检测出来的零形式类别,以达到有定的零形式识别的目的,为开展有定的零形式消解迈出了重要的一步。本文的主要研究内容包括:(1)研究基于规则的零形式检测方法。零形式是由核心框架元素缺失引起的,但并不是所有的核心框架元素缺失都能引起零形式,这是因为核心框架元素之间还存在着彼此之间相互依赖和制约的三种关系。在深入学习这些关系的基础上本文总结出一套用于判断零形式的规则,继而提出了基于规则的零形式检测方法,实验的召回率为60.1%。(2)研究了基于最大熵的零形式分类方法。根据对缺失成分的解释类型,零形式分为有定的零形式和无定的零形式两类,据此在零形式检测的基础上,将有定的零形式识别转化为一个二分类的问题。从词和语义两个层面分别选取了tgt,pos,lemma, frame等几个与零形式类型最密切相关的特征,采用基于最大熵模型的方法完成了分类,实验得到的准确率为53.5%,接近评测任务给出的最好结果。
其他文献
语义Web粗糙模糊本体是语义Web模糊本体的一种扩展,亦可看作是对语义Web本体“先模糊,后粗糙”的扩展,由粗糙模糊概念及粗糙模糊概念之间关系组成。作为不精确性知识的一种表示
三维图形作为第五代媒体形式,在各个领域得到了广泛的应用,比如电子商务,虚拟环境等。一般三维图形通过三维网格模型表示,在实际应用领域,一方面要求建立的三维网格模型的复杂度和
研发项目过程的数据管理以及企业系统的集成化都是在行业中提高企业竞争力的关键因素。随着企业应用系统数量不断增加,异构的应用系统之间交互困难形成一个个“信息孤岛”。传
近年来,计算机应用的快速发展以及网络的普及为人们的生活、工作带来了很大的方便,但是,随之而来的计算机病毒对用户产生的危害也越来越严重,在各种利益的驱动下计算机病毒的
车间调度问题的复杂性使得传统的常规方法已经很难或者无法解决,研究新的解决方法显得越来越重要。近年来,以借鉴自然现象形成的智能优化算法因其良好的性能而得到了广泛的应
随着信息技术的飞速发展,互联网在人们的工作和生活中有着不可或缺的地位。然而在人们享受网络带来便利的同时,也面临着各式各样的威胁。异常检测作为网络安全领域一种重要的技
人机交互作为人与计算机之间实现有效互动的具体方法,多年来一直受到研究人员很大的关注。交互方式的不断演变和创新,为人机交互技术的发展提供了更加广阔的发展空间,也使得对交
Gabor变换是由英国物理学家Dennis Gabor于1946年首次提出的一种重要的联合时频分析方法,它可以将一个信号从时域映射到联合时频域。Wexler和Qian等人在Dennis Gabor的工作的
基于单幅图像的三维重建是基于图像三维重建的一个重要的研究领域,它是利用单幅图像的几何约束或者纹理等信息及有限的先验知识,实现物体的三维重建,是计算机视觉、图像处理
随着无线传感网络的发展,移动传感网络逐渐进入人们的生活,在城市管理、环境监测、医疗卫生等领域广泛应用。由于移动传感网络中传感器节点具有移动性,因此导致网络拓扑结构高度