零形式识别与填充方法及应用研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:lxkeinsun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
零形式(Null Instantiation,NI)是指句子中隐式的语义成分,这些语义成分的正确理解将会影响篇章语义的完整性。对于机器来说,识别与实现隐式语义成分的内容填充是一个较难的任务,需要借助相应的语境,准确地理解语篇,才能有效解决该问题。汉语框架网(Chinese FrameNet,CFN)是从框架语义的角度去描述句子的语境,包含刻画句子特定语境的语义信息。本文基于汉语框架网对零形式进行识别与填充,并将其应用于框架关系判别任务。本文主要工作如下:(1)零形式识别研究。本文根据缺失的语义论元在语义理解上的不同,对零形式进行识别,分别基于传统机器学习与深度学习进行研究。在基于深度学习方法中,首先输入层包含词嵌入和框架表示,其次使用BiLSTM获取上下文信息,最后通过全连接层预测零形式类别,其中探索了基于WASBIE、Word2vec算法及基于框架关系的三种框架表示方法;在基于传统机器学习方法中,构建最优特征集,分别在决策树和随机森林算法上进行实验,得到零形式类别。结果显示,本文构建的零形式模型比baseline结果提高了2%-9%。(2)有定零形式填充研究。本文针对识别出的有定零形式,为其在语篇上下文寻找填充内容。首先提出改进的SMOTE(Synthetic Minority Oversampling Technique)算法扩展数据,为零形式填充提供平衡的数据集。其次在构建分类模型过程中融入语义特征,并借助框架元素间的映射关系提升零形式填充效果。结果显示,融入数据的平衡化处理及语义信息比baseline结果提高了12%。(3)零形式识别与填充在框架关系判别中的应用研究。框架关系判别任务是框架语义分析任务的难点,本文将零形式识别与填充应用于该任务,初步探索了零形式对该任务的影响。首先定义框架关系判别任务,其次对于句子中涉及到的零形式,采用前述方法将其在上下文中的填充内容找出,最后选取相关特征构建分类模型,判别框架间是否具有联系。结果显示,零形式的加入使得框架关系判别任务的F1值提高了1.53%,表明零形式对框架关系判别具有积极的作用。
其他文献
近年来,深度学习一直是计算机领域的研究热点,随着研究的不断深入,深度学习目前在理论上达到瓶颈期。数据集的质量和大小对于深度学习模型最终性能的影响至关重要。生成对抗
本文运用Lyapunov泛函方法,矩阵不等式以及数学归纳法研究了几类具有脉冲时滞的神经网络系统,得到了系统平衡解稳定的充分条件,改进和推广了相应文献的结果.全文主要分为四章
网络化控制系统(Networked Control Systems,即NCSs)是通过共享网络将被控对象、控制器、传感器以及执行器连接起来的闭环系统。其系统结构庞大又复杂,且各部件发生故障的可
运动目标跟踪在军事、智能交通、智能视频监控和人机交互等领域都有非常广阔的应用前景。在实际应用中,目标外观变化、背景干扰、目标遮挡和出视野等问题会影响跟踪的精度。
随着我国经济的不断发展和资本市场的完善,并购重组成为企业扩张成长的常见办法,随着这一交易形式的兴起,业绩承诺条款在并购交易中的使用也愈加频繁,成为企业并购重组的基本
上面千条线,下面一根针,基层政府做为我国政治体系的最末端,被要求落实中央及上级政府的各项政策,发展本地经济水平,做好民生工程。但出于促进地域经济发展的需要、基层政府
苝酰亚胺类化合物于1912年被首次发现并合成成功,在1913年时被当作一种红色染料,用于还原染料领域,在1950年的时候又发展到了有机颜料领域,目前,还被研究者们认为是一种非常
当前世界经济形势复杂多变,国内经济形势面临较大的下行压力,金融监管不断趋严,国家相关部委、金融监管部门相继出台政策,强化去杠杆、去通道,引导资金脱虚向实服务实体经济,
脑机接口是一种将大脑活动信号转换为控制指令,从而对外部设备的操控的新型人机交互技术。本文考虑到构建视觉独立的脑机接口范式在一些特定场景下的必要性,选取触觉通道作为
钙钛矿材料由于具有高吸收系数和载流子迁移率、低缺陷态密度、可调的发光波长以及较长的载流子扩散距离等特点,成为近年来半导体光电材料领域中的“超级明星”,其研究领域从