面向新闻文本的事件推理方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:HNLYLKT
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件推理研究是通过一系列的事件上下文序列来推断后续可能发生的事件,是事件提取与分析方向的研究热点之一。本文的研究对象是具有某种逻辑关系的事件集合,研究目标是根据事件之间逻辑关系的先验信息从候选事件中选择后续最有可能发生的事件。新闻是信息传播的重要载体,其中包含有大量的客观真实事件,从新闻文本中抽取事件并进行推理分析有助于快速准确地从中获取相关事件之间的发展脉络和关联信息。为此,本文提出了一种面向新闻文本的事件推理方法,该方法通过对大规模的新闻文本进行事件链抽取及聚类,形成具有相似主题与情景的事件链簇,然后通过构建基于事件演化关系的事件图谱完成事件推理任务。本文的主要工作研究如下:(1)针对传统的叙事事件研究存在的事件之间关系单一的问题,本文提出了融合事件因果关系的事件链抽取方法,该方法通过显式的因果连接规则从文本中识别因果事件语句对,再基于依存句法分析、词性标记和指代消解等自然语言处理技术识别事件组成元素。将因果事件对作为共同主人公事件链的补充信息,丰富了事件之间的连接关系,是后续构建多关系的事件演化图谱的基础工作。(2)针对无监督的事件抽取方式噪声干扰较大且未能充分利用事件序列之间的关联性等问题,本文提出了一种基于叙事事件链聚类的方法来处理叙事事件,该方法通过的不同事件链表示形式对大规模事件链进行聚类,从而得到有相似情景和主题的事件链簇,以此作为事件推理研究的基础。后续实验表明该方法能有效提升事件推理任务的准确率。(3)针对现有的事件特征学习方法未能充分挖掘事件序列中不同事件对下游事件存在差异性影响的问题,本文提出了一种融合多头注意力机制的门控图神经网络模型(GGNN-MHA),该模型充分考虑了事件序列中各个事件对于待预测事件的影响以及事件之间的演化特征,相对于传统的基于统计概率模型和循环神经网络的事件特征学习模型,这种基于多头注意力机制的图神经网络模型在事件图式学习中有更好的效果。
其他文献
目的:鼻咽癌的发生和发展与EB(Epstein-Barr)病毒感染显著相关。潜伏膜蛋白1(latent membrane protein 1,LMP1)被EB病毒编码,通过介导NF-κB信号转导通路在鼻咽癌的发病机制中起着重要作用。肿瘤坏死因子α诱导蛋白3(tumor necrosis factor alpha inducible protein 3,TNFAIP3)作为一种泛素编辑酶,在NF-κ
头颈癌在全世界癌症中发病率排名第六,5年总生存率只有50%。其中90%以上为头颈部鳞癌。根据课题组前期研究,细胞外囊泡在肿瘤微环境中发挥着信息交流的作用,并且癌细胞热衷于利用这种通讯工具,与免疫细胞相互作用,协助肿瘤免疫逃逸。因此本研究探讨了头颈鳞癌在乏氧、放疗刺激下分泌的细胞外囊泡(EV:Extracellular Vesicles)对巨噬细胞产生的影响,并利用代谢组学探讨可能涉及的代谢通路的改
4μm波段激光在工业生产及国防军事等领域具有重要应用,这使其成为光纤激光的重要发展方向,直接激射稀土离子掺杂光纤在产生1~3.5μm激光的应用中已显示出简单高效的优势,然而,目前国际上还未有实现4μm波段光纤激光高效激射的有效方案,因此,探索稀土离子掺杂光纤在4μm波段的激光动力学特性,对产生高效4μm波段激光具有重要科学意义和应用价值。针对现状,本文着重研究了掺Ho3+和Dy3+氟化物光纤在4μ
鲁棒自适应波束形成算法(Robust Adaptive Beamforming,RAB)一直是阵列信号处理领域一个重要的分支,在很多领域都有着广泛的应用。在传统的鲁棒自适应波束形成算法中,普遍存在的一个问题就是估计的期望信号导向矢量会收敛于干扰子空间,使得期望信号被当做干扰抑制,而干扰被当做期望信号无失真输出,从而导致波束形成器的性能下降。为了提高自适应波束形成器对各种误差因素的鲁棒性,本文进行了
人工智能中的推理研究表明人类大脑很多时候并不是完全基于精确推理的,现实世界的信息是不完备的。一方面,信息往往具有不确定性,这意味着我们通常对感兴趣的变量施加软约束(soft constraint)。另一方面,在处理真实世界中不完美的信息时,只考虑不确定性是不够的。信息的另一个重要性质是它的部分可靠性。事实上,对变量的任何估计,无论是精确的还是软的都取决于我们对所处理的信息来源的信心。因此,不确定性
城市环境多路径信号联合探测技术指的是利用城市环境中丰富的电磁波衍射、反射多径信号,实现对建筑环境非直视目标检测、定位、成像及跟踪的技术,其是实现建筑遮蔽目标探测的新质手段,该技术在反恐维稳、城市巷战、区域监视和智能驾驶等领域具有重大的研究和应用价值。本文围绕建筑环境非直视目标探测问题,开展了城市环境多路径信号联合探测的基础理论问题研究,主要内容如下:1、针对复杂城市环境探测场景,首先基于电磁场与电
由于目标与环境场景具有紧密相关性,根据SAR图像场景先验信息,在SAR图像中快速获取目标潜在区域,是提高目标检测效率、降低虚警、实现目标精确检测的首要环节。高分辨率SAR图像地物具有起伏变化明显、纹理特征丰富等特点。基于像素级的处理方法的计算粒度过于精细,而且没有充分考虑像素间的空间组织关系,因此难以有效获取SAR图像多尺度目标潜在区域。本文围绕SAR图像,主要解决多尺度地物分类精度低、目标潜在区
传统保护区采用护林员巡逻方式进行自然防护及动物寻踪,但往往效率较低,且人力物力消耗较大。通过部署保护区通信系统,可以较好的改善信息闭塞的现状,一方面,可提高信息(文本、图像、视频等)的传输灵活性;另一方面,能降低护林员定期维护巡回的频次。不同环境及需求的保护区,可因地制宜地采取网络架设方案:对有配套供电、线缆及机房条件的保护区,可部署有线视频传输系统;对仅有供电条件的保护区,可部署嵌入式无线传感器
三维地质模型是描述及表示地下结构的重要工具,是地质学者研究关键地质构造的参考依据。地震解释数据具有不连续性、不一致性,传统建模过程仅从计算机图形学的角度入手,重构的模型可能存在构造不合理之处,构造建模的难点就是这样信息缺失的条件下构造出符合地质规律的合理模型。因此,从地震解释数据模型中提取出语义信息,是三维地质建模中的关键环节。现有的地质模型语义描述体系着力于对其几何形态的研究,而忽略了其中隐含的
随着计算机和多媒体技术的快速发展,以图像、视频为信息流的互联网、物联网产品不断涌现,自媒体时代已然来临。在直播网站、视频号、影视媒体等依托视频作为信息主要载体的平台上,时时刻刻的传输着海量的视频数据,并呈现着更新周期短、产生速度快、种类多等特点。与此同时视频数据存在着存储成本高、不易维护和检索困难的问题,尤其是监控类视频中包含大量冗余信息,无法快速定位关键信息。因此迫切需要研究一种能对视频中感兴趣