【摘 要】
:
中文篇章级金融事件抽取是事件抽取领域的一个重要研究方向,旨在从篇章级金融文本中抽取出对应的金融事件信息。现有的中文篇章级金融事件抽取研究热点是如何在篇章级别文本下进行跨句事件抽取。其主要研究如何构建端到端的模型进行事件抽取,大部分研究都是在模型层次上。然而这些工作忽略了词表、特定领域和标签层次等外部知识。这些外部知识对中文篇章级金融事件抽取的性能提升有很大帮助。为了解决上述问题,本文提出了以下两个
论文部分内容阅读
中文篇章级金融事件抽取是事件抽取领域的一个重要研究方向,旨在从篇章级金融文本中抽取出对应的金融事件信息。现有的中文篇章级金融事件抽取研究热点是如何在篇章级别文本下进行跨句事件抽取。其主要研究如何构建端到端的模型进行事件抽取,大部分研究都是在模型层次上。然而这些工作忽略了词表、特定领域和标签层次等外部知识。这些外部知识对中文篇章级金融事件抽取的性能提升有很大帮助。为了解决上述问题,本文提出了以下两个工作:(1)提出了融入词表信息的篇章级金融事件抽取框架,解决了现有中文篇章级金融事件抽取中实体抽取子模块存在的一些不足。实体识别在事件抽取任务中扮演着重要的角色,其识别的结果对事件抽取最终的结果有着重要的影响。现有主流的事件抽取方法仅将实体识别子任务视为字符级别的序列标注任务,且仅使用字符级别的特征向量。字符级别的实体识别任务的一个显著缺点是未充分利用单词语义信息和单词序列信息,这些信息在相关研究中被证明对实体识别任务是有用的。基于以上观察,本工作引入了一个简单有效的模型,将包含语义信息和序列信息在内的词表知识融合到字符级别的特征向量。通过这种方法可以显著提高实体识别子任务的性能,从而帮助提高事件抽取任务的性能。另外,引入的方法不会增加模型的复杂度,因此不会降低模型的执行效率。同时为了进一步增强特征表示,本工作将外部的领域知识引入到文本特征向量当中。本工作在由大量中文上市公司公告构成的数据上进行了相关实验,实验结果表明了方法的有效性。同时本工作还设计了相关实验来验证方法的执行效率,实验结果验证了方法的高效性。(2)提出了基于事件元素相关性的篇章级金融事件抽取框架,解决了现有篇章级金融事件抽取中事件元素分类模块存在的一些不足。事件元素分类是事件抽取的最后一步,其主要作用是将实体抽取子任务抽取的事件元素实体和对应的事件关联起来,在事件抽取任务中扮演重要角色。现存工作的事件元素分类模块只对每个事件元素角色单独分类,而忽略了不同元素之间隐藏的相关性。基于以上观察,本工作通过引入相关模块去挖掘标签层次有用的外部信息,从而让其服务于篇章级金融事件抽取任务。本工作主要挖掘标签所蕴含的层次化结构信息和关系层次信息。首先,通过构建层次化的训练模块和层次化的解码模块来利用标签的层次化信息。然后,借鉴多任务学习的相关思路,在原有的事件抽取框架的基础上,将事件主体抽取拆解为实体识别、关系抽取和事件抽取。通过共享特征提取模块,构建联合训练子任务的方式实现事件抽取,从而将事件元素在关系层次上的相关性引入到中文篇章级金融领域事件抽取任务当中去。本工作通过在由大量中文上市公司公告构成的数据上进行了相关实验,实验结果表明本工作提出的方法有效性。
其他文献
近年来,随着移动通信技术快速发展,圆极化天线以其独有的特性被广泛用于各种各样的无线通信系统中。天线作为通信系统的不可缺少的一环,对其性能的要求也越来越高,如要求天线要具有尺寸小,宽频带,高增益,方向图良好,低成本等特性。在一些空间有限的无线通信设备中,也通常需要天线具有低剖面的结构特性,但同时具备宽带和低剖面的特性还有待研究。因此,本文主要对宽频带和低剖面这两个特性设计了三种圆极化天线,主要内容为
大规模多输入多输出(Massive Multiple Input Multiple Output,Massive MIMO)技术作为第五代移动通信系统的关键技术之一,相对于传统MIMO技术来说,增加了更多的天线数量,在系统容量、频谱效率、数据传输速率和传输可靠性等方面显著提升了系统性能。但是随着基站天线数和用户数的增加,Massive MIMO信号检测过程的计算复杂度较高,难以实现,是研究的难点问
随着大数据时代的到来,人们对自动驾驶、计算机视觉、语音识别等数据密集型应用越加的重视。现如今,几乎所有先进的计算平台都是基于著名的冯·诺依曼架构,由于其计算和数据存储分开的特性,在处理数据时需要在计算模块和存储模块之间进行频繁的数据传输,从而造成了“内存墙”的问题。为了解决“内存墙”的问题,很多学者提出了“存算一体化”的概念,即将部分计算模式嵌入到内存中,从而减少处理器和存储模块之间的数据传输。静
随着数据分析技术的迅速发展和智能终端设备的广泛应用,数据聚合成为各个领域中的一项重要技术。在面向边缘计算的数据聚合中,边缘服务器收集和聚合来自终端设备的感知数据,以提供智能计算和实时控制等服务,并且将聚合结果上传给云服务器,从而执行全局的数据分析。考虑到感知数据可能涉及终端用户的隐私信息,面向边缘计算的隐私保护数据聚合方案被相继提出。隐私保护原始数据聚合支持服务器收集原始感知数据,从而可以计算任意
检索任务一直都是学术界和工业界关注的热点,最初的工作主要集中在单模态检索上,例如用图像检索与之相似的图像。但是现如今互联网的发展速度非常快,人们频繁地使用手机中的各类软件,生产出大规模的多模态数据,例如图片,文字,视频和语音等等,以往的单模态检索技术面对人们多样化的检索需求开始变的逐渐乏力,例如人们想要通过一幅图像搜索出与之相关的视频片段或者文本描述。因此为了更好地满足人们的需求,同时更好地利用这
车辆在行驶过程中会发送包含位置的消息从而达成以下目的:告知周边车辆自己的实时位置,减少交通事故的发生;向基于位置服务的服务器请求新闻资讯、社交、娱乐等网络服务,改善驾驶体验。而由于车联网具有大规模的网络结构和开放的无线信道,车辆位置隐私信息每时每刻都暴露在网络中,如果这些隐私信息不能得到保护,用户的隐私将会泄露。传统的位置隐私保护方案提出使用假名来保护车辆的位置隐私,然而简单地假名更换并不能满足车
全息视频显示的核心器件是空间光调制器(Spatial Light Modulator,SLM),现有的SLM设计都是基于经典的光学原理,无法满足全息视频显示所需的大空间带宽积及大视场角等需求,因此我们需要借助最新发展的等离激元学和微纳技术来解决全息视频显示所面临的核心问题。但目前的微纳光场调控器件大多集中在无源,而有源微纳SLM器件的研究及技术开发仍然面临很大的挑战。区别于现有的利用光程差原理的硅
面对大幅度提高5G频谱效率的要求,一种新的多址接入技术被提出,即非正交多址接入(NOMA,Non Othogonal Multiple Access)。在3G时代使用的码分多址(CDMA,Code Division Multiple Access)技术中,多个用户共享一个信道资源,用户的地址码具有一定的相关性,这就导致解码时,用户之间相互干扰。而在正交多址(OMA,Othogonal Multip
与传统干涉测量方式相比,激光回馈干涉法凭借灵敏度高、结构紧凑、无需准直等优势,成为了检测微弱信号的计量学方法之一。但现有激光回馈干涉系统中低频噪声严重限制了该技术的应用场合。因此,我们提出一种基于移频技术的全光纤结构的激光回馈干涉位移传感系统,通过结合声光调制技术有效解决低频噪声对待测信号的干扰,成功实现了非合作目标几十皮米级的微小位移传感。同时,通过建立激光回馈移频干涉位移传感系统中探测灵敏度的
随着信息化时代的到来,全球学术研究活动快速发展,学术文献的发表数量日益增长。为了解决海量学术文献难以管理这一难题,以互联网技术为核心的大规模文献数据库、学术检索平台等应运而生,极大地改变了科研学者对文献数据的检索方式。然而,来源于不同文献检索系统的作者存在同名现象,使得许多同名作者的学术文献无法进行正确的归属,降低了学术检索的准确性。目前大量学者提出了基于机器学习或基于图的作者同名消歧算法,但存在