图神经网络在中文金融事件抽取系统中的研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ha1cy0n
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件抽取作为自然语言处理领域的重要任务,旨在从无结构文本提取出能描述一个事件构成的结构化信息元组,实现关键信息的提取与压缩,被广泛应用于信息抽取、风险控制、情感分析等领域中。然而传统事件抽取研究主要对针对英文文本领域提出了抽取模型,未对中文文本领域特别是应用广泛的中文金融文本领域进行深入的研究。并且由于监督学习中需要高昂繁琐的人工标注成本,可用训练数据集小,应用范围狭隘。针对上述问题,本文的主要贡献主要包括如下三个部分:1.提出了基于图注意力网络的中文金融事件抽取算法(CAEE)。CAEE模型通过将事件抽取任务作为字符级别的序列标注任务,通过词语嵌入的方式将词语信息融入到字嵌入向量中,然后通过依存句法分析构造基于字词结构的同构图,再通过图注意力网络进行聚合,融合句法信息。最后通过联合抽取得到最后的抽取结果。为了验证模型在中文文本上的有效性,本文收集并标注了中文金融新闻,得到了中文金融事件抽取数据集。CAEE模型算法在该数据集和ACE2005数据集上对比已有事件抽取模型获得了显著的提升,证明了模型对于中文文本领域的有效性。2.提出了基于对抗训练的事件抽取远程监督模型(DSEE),先借助已标注的数据集和知识图谱训练事件检测模型,并通过知识图谱的三元组对无结构文本进行标注。再利用对抗训练的方式训练生成器和辨别器,使得生成器有能力筛选出可信度较高的生成数据集,最后得到筛选后的远程监督数据集。本文通过人工验证和事件抽取验证结果两种方式证明了DSEE的有效性。3.结合CAEE和DSEE两种算法,对中文金融事件抽取原型系统进行了设计和实现,系统主要包含训练数据集生成,模型训练,模型预测三个模块,和用户交互端,服务器端和算法端三个模块。用户交互端主要提供用户可视化操作界面和结果展示界面。服务器端主要响应请求并调用对应的算法端接口。算法端主要根据CAEE和DSEE算法执行事件抽取和训练数据集生成任务,并返回相应结果。
其他文献
<正>根据国际能源署(IEA)于2020年2月发布的一份报告[1],全球与能源相关的二氧化碳(CO2)排放量在2019年趋于稳定,为33Gt。这一稳定是在全球经济增长速度为2.9%的背景下发生的[2]。二氧化碳排放的明显停滞掩盖了由于地理、技术和商业波动而导致的排放量增加和减少的多样性。它还掩盖了一个"两个世界"(two worlds)的现象:发达国家正在向清洁、可再生能源(主要是风能和太阳能)的
期刊
文章以电气控制与PLC课程为例,针对传统课程教学模式存在的问题,提出了“以结果为导向、以项目为引领、以任务为驱动、以理实融合为手段、以质量评价为落脚点”五位一体的PBL教学模式,探讨如何在“新工科+工程教育认证”背景下实施课程教学改革。首先将毕业要求作为课程教学改革的出发点,设置课程教学目标,然后将本课程的授课内容划分为7个教学项目,针对每个项目设计教学内容和教学模式,打破该课程传统的讲授式教学方
<正>工业4.0背景下,新一轮以"广义现代职业性"为主要特征的教育改革使得德国传统的劳动课程体系面临新的挑战。德国作为欧洲劳动教育发展最具代表性的国家之一,积累了丰富的学校实践经验。德国学校劳动教育的一些具体经验可以为我国劳动课程的开发与实施提供有益借鉴。德国劳动教育的学科发展与时代挑战德国劳动教育思潮兴起于20世纪初期,由于现代化发展迅速,工业、制造业急需学校教育为德国社会培养大量的专业技术人才
期刊
博物馆基础研究和博物馆发展研究在苏东海的博物馆学思想中占有很大的比重。前者重点关注“博物馆是什么”“什么是博物馆的核心价值”等问题,指向的是博物馆的“不变”;后者则侧重于“处于演变历程中的博物馆”“博物馆的发展趋势与动向”等命题,指向博物馆的“变”。相应的,苏东海的博物馆发展研究包括“博物馆发展历史研究”和“发展趋势研究”。本文将分别论述这两个方面,并在此基础上探讨博物馆发展研究在苏东海博物馆学思
针对交叉领域技术涉及非常广泛的情况,结合IBM公司实际案例的审查过程,分析讨论了站位本领域技术人员的过程和重要性,并提出了关于交叉领域如何站位本领域的一些思考。
期刊
<正>滔滔大河,滚滚东来,澎湃的黄河水经三门峡、八里胡同后,终于突破窄峡的束缚,抖落一身黄沙,在小浪底大坝的臂弯中汇成万顷碧波,于是“高峡出平湖,山川入彩图”。小浪底这颗年轻而强大的心脏,给古老的黄河带来新的活力,在黄河流域生态保护和高质量发展战略引领下,谱写着生机盎然的新时代黄河乐章。“黄河斗水,泥居其七”。黄河是中华民族的母亲河,也是一条桀骜难驯的忧患之河。由于暴雨集中、植被稀疏、土壤抗蚀性弱
期刊
目前我国通过合伙企业进行投资的情况越来越多,投资的方式也越来越复杂,投资人往往又是拥有过多财富的个人,而税法对合伙人转让合伙企业财产份额等相关事项在税收政策和征管上均不是非常明确,导致实践中征管不统一。通过分析提出相关税收问题的适用。
以搭载某自然吸气四缸汽油发动机的混合动力车型为研究对象,选取心理声学客观参数响度、粗糙度、尖锐度进行客观评价研究,并通过径向基函数(RBF)神经网络方法建立该车型怠速声品质预测模型。结果显示:采用RBF方法得到结果的一致性较高,预测精度较高。建立基于RBF的噪声品质客观评价参量的灵敏度模型,计算影响该车型怠速声品质的客观评价参量贡献度,其中粗糙度特征的贡献度影响最大,尖锐度次之。通过分析曲轴系统和
期刊
<正>合伙企业内部控制是为提高企业经营效率,实现经营目标,合伙人对企业人事制度设计、生产计划推进、会计信息资料核查等经营活动在企业内部形成并推行的业务组织框架设置和各司其职的分工制度,从而达成对合伙人一揽子可操作的相互制约和平衡机制,合伙企业有效的内部控制在社会经营活动日益复杂的今天有着重要而现实的意义,本文笔者拟合伙企业内部控制谈谈个人的看法。
期刊
<正>The popularity of online shopping among Chinese women offers plenty of business opportunitiesLiu Ying,28,is a website editor living in Beijing and has been a hardcore online shopper since 2008.Each
期刊