基于ELECTRA模型与词性特征的金融事件抽取方法研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:sinner888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]针对当前金融事件抽取中金融事件实体边界模糊,抽取不准确的问题,本文提出基于预训练模型ELECTRA和词性特征的金融事件抽取方法。[方法]为了增强模型对金融关键实体的感知力,充分考虑语料原始的语义信息以及词性特征信息,首先将语料分别通过两个ELECTRA预训练模型后进行融合操作,达到增强语义的效果,其次将学习到的信息传入到BiGRU中,获取上下文长距离的语义依赖,输出原始的序列标签,最后利用CRF克服标签偏差问题,通过上述步骤完成金融事件抽取。[结果]本文提出的基于预训练模型ELECTRA和词性特征的金融事件抽取方法在金融事件数据集上F1分数达到了70.96%,比经典的抽取模型BiLSTM-CRF性能提升了20.74%。[局限]数据集中事件数较少,预训练模型体积较大,会受到GPU/TPU内存的限制。[结论]本文提出的模型能够更加全面捕捉金融事件元素之间的联系,提升金融事件抽取的效果。
其他文献
用于知识发现的大部分数据挖掘工具均采用规则发现和决策树分类技术来发现数据模式和规则。该文通过采用基于仿真属性的离散化方法,基于概率统计的未知属性与噪声数据处理方法以及基于误差的剪枝算法,实现了用于自动生成决策树的通用算法模板。利用该模板,决策树算法的设计者可以快速验证为解决特定决策问题而设计的新算法。构造决策树的基本机制是算法的设计者利用其自己定义的公式来初始化通用算法模板。然后利用该系统提供的交
模糊控制和滑模控制的结合提供了非线性控制的一大新方法,它消除了滑模控制的抖动,但同时带来新的问题———静差,而且这种控制器在控制切换时动态性能与滑平面系数选择有很大关系。鉴于以上问题,该文提出用不均匀分布隶属函数的模糊控制器来代替传统滑模控制器的符号函数,同时为了保证模糊控制系统的全局稳定性,考虑加入模糊监督控制器。再基于遗传算法对滑平面系数和因子寻优,在算法中目标函数是系统的误差和表征系统稳定性
计算机生成兵力(CGF)技术在水面舰艇编队智能化生成和仿真方面有着十分广阔的应用前景.该文从计算机生成水面舰艇编队兵力(CGSF)实体模型入手,研究了水面舰艇单舰及战斗编队
我厂用了近两年的时间开发了计算机拉延模辅助设计系统(简称拉延模CAD)。本文从工艺分析与计算、模具设计与工作图绘制两方面,简要介绍本系统之功能及编程思路与特点。
该文基于指挥自动化系统的实际需求特点,分析了指挥自动化系统评价工作的难点问题,给出了系统的效能评估流程,共分为问题明确、系统方案分析、指标选取、实际评估四个阶段。在此基础上,设计了指挥自动化系统效能评估环境(简称为C3IEEE),进行系统总体设计和系统实体设计,包括其功能结构,工作流程、系统数据结构以及与仿真的接口等。所设计的效能评价系统既可做独立评估系统使用,也可外接仿真系统,提供一体化的仿真评
受新冠肺炎疫情影响,菜农在生产中遇到问题时越来越依赖通过微信、QQ等线上渠道进行咨询,现就近期农户提出的问题进行汇总归类,以期对广大生产者有所帮助。
构建了概率论和随机现象计算机模拟仿真演示系统。该系统包括六个子系统:人机界面、内核、集合论、概率分布、随机现象和帮助子系统。该系统可以完成的模拟演示包括:集合运算、教材中常见的概率密度函数和累积概率分布函数、概率游戏、概率论题解以及蒙特卡洛模拟等。学习者应用该系统可以对抽象的概率论理论、运算以及相关随机现象进行形象直观地观察和研究,该系统在概率论的教学中起到了类似实验室的作用,弥补了概率论常规教学
在智能交通系统(IntelligentTransportationSystem,ITS)中,空间数据库的实现和访问至关重要。随着ITS的发展,基于传统的纯关系型数据库设计的空间数据库系统,其属性数据和空间数据是分开存储的,难以满足新型ITS在内容、数量、类型、关系等方面高速增长的要求。为此一些数据库厂商对传统的关系型数据库技术进行了扩充,并推出了一序列新的数据库产品,如Oracle公司的Oracl
文章介绍了目标车辆震动场模拟系统的研究目的和实现的功能,详细介绍了震动场模拟系统的系统组成结构、震动控制系统的系统控制结构,并给出了结构框图.系统是在目标物理场数
<正> 在中空吹塑中,机头提供出型坯,经二次加工后,才得到制品,所以机头设计和制造往往不被人们重视。其实,制品质量的优劣,相当程度地取决于机头的好坏。为了进