基于深度学习的金融事件抽取技术研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:yangzhehang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取是一种获取结构化信息的技术手段,其主要通过事件框架的形式从文本中提取出任务所需的重要信息。在具体实现中,该技术通常使用预定义的事件框架,按框架中事件的各个组成部分对文本中的信息进行筛选。在金融领域中,事件抽取可以为风险评估、知识图谱等多种下游任务提供基础的结构化数据。然而,受语言特性、文本特点和专业领域知识等多方面的影响,当前金融事件抽取研究主要面临两方面的挑战:1)金融领域至今未形成对金融事件抽取任务的标准定义,因此也没有针对事件类型的统一划分,从而也未形成事件抽取任务中所使用的预定义框架。2)以财经新闻为代表的金融领域文本普遍具有篇幅长、语义信息丰富、句法复杂度高等特点,为事件抽取模型带来了语义理解上的困难。针对上述问题,本文以财经新闻为基础,提出了基于深度学习的金融事件抽取方法,并最终构建了金融事件抽取系统,该系统包括:1.基于金融事件库的中心事件抽取方法,其目的是从文本中定位中心事件句并进行事件抽取。该方法包含三个组成部分:金融事件库,中心事件句判定算法以及基于序列标注的事件论元抽取模型。其中,金融事件库由预定义的金融事件类型表、金融实体关系表以及触发词词典组成,是后续算法和模型的重要依据。中心事件句判定算法通过包含三种衡量标准的判定规则,在文本中定位中心事件句,并提供该句对应的触发词信息。最终,中心事件抽取方法采用序列标注的思想,通过动态词表示模型,双向的长短期记忆网络和条件随机场实现对事件论元的识别。2.针对多事件文本的事件主体抽取方法。作为中心事件抽取方法的补充,该方法主要针对在中心事件抽取任务中不易处理的多事件类型文本,避免事件抽取的退化。该方法通过事件类型重构和事件主体抽取,实现高效的事件信息的抽取。其中,事件类型重构通过对触发词和事件论元间互信息和信息熵的计算,获取词语间的共现程度,找到合理的短语组合以形成组合型事件类型。同时,该方法使用问答三元组的形式对事件主体抽取任务中的各组成部分进行封装,将抽取任务转化为机器阅读理解任务。最终,通过预训练语言模型BERT,以多轮问答的形式实现了对多事件文本的事件主体抽取。3.金融事件抽取展示系统。该系统实现了对财经新闻文本的中心事件抽取和事件主体抽取,并且通过可视化界面实现与用户的交互。
其他文献
1病例报告患者刘某,男,57岁。因“头部外伤致双眼视物重影半年余”于2012年6月6日来本科就诊。半年前因头部外伤致昏迷,后送往医院。头颅CT示:右侧额颞及右眼眶外侧壁骨折。患者
温室栽培泾渭鲜枣,一年两熟,产量高、上市早,种植效益好。  投资规模:每亩投入3万元左右。其中日光温室投入1万元左右,种苗(每亩1000~1100株)投入近2万元。  适宜地区:全年日照时间在2000小时以上的地区。  适合人群:适种区农民;有一定资金,愿意到乡下或郊区租地经营的城里人。  品种介绍  泾渭鲜枣是目前惟一一个通过温室栽培,可实现一年两熟、并在6月第一次成熟的早熟枣树品种。该枣适应性
2003年10月24日,亚洲权威银行业期刊《亚洲银行家》发表了年度亚洲300强商业银行的最新排名。出人意料之外的是,中国四大国有银行在榜上的风头,明显不敌中国几家股份制商业银
欧洲正处在一个相悖的转折点。一方面是协调各国法律,制定共同宪法,加深欧洲的融合;另一方面,欧洲的体制却没能产生一个政治共同体存活或繁荣的根本条件:
“腐败高发时期,从来没有因为严刑峻法而消除腐败,反而会因为严刑峻法而使腐败愈演愈烈
在现代信息化战争条件下,随着反舰导弹打击精度的大幅度提高,大型水面舰船面临着越来越严酷的毁伤威胁。当半穿甲反舰导弹侵彻舰船舷侧在其内部发生爆炸时,所产生的高强冲击波与高速破片群对舰船结构和设备人员造成毁灭性打击,严重削弱了舰船的战斗力。鉴于此,目前大型水面舰船多采用多层防护体系来减小武器战斗部爆炸所引起的毁伤程度,液舱作为多层防护体系中的重要组成单元,其对于战斗部载荷的防护能力直接影响着整个体系的
由彭家技能研究所研制的“彭家豆腐”系列豆制品,用独特的配方点浆,用绢包的方法做出外形独特的绢包豆腐,其豆制品系列中的方干、于张、臭豆腐、酱油干、茶干等因点浆配方独特而
随着互联网的普及,网购成为一种新型的购物形式。目前网购热潮持续不断,快递却跟不上步伐,阻碍其进一步发展。只有解决快递存在的问题,提升其服务质量,才能让网购进入良性发