融入BERT的企业年报命名实体识别方法

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:jiangyang0266
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动提取企业年报关键数据是企业评价工作自动化的重要手段.针对企业年报领域关键实体结构复杂、与上下文语义关联强、规模较小的特点,提出基于转换器的双向编码器表示-双向门控循环单元-注意力机制-条件随机场(BERT-BiGRU-Attention-CRF)模型.在BiGRU-CRF模型的基础上,首先引入BERT预训练语言模型,以增强词向量模型的泛化能力,捕捉长距离的上下文信息;然后引入注意力机制,以充分挖掘文本的全局和局部特征.在自行构建的企业年报语料库内进行实验,将该模型与多组传统模型进行对比.结果表明:该模
其他文献
早期阅读越来越受到家长的重视。家长的阅读观直接影响其在孩子早期阅读中发挥的作用。研究主要运用问卷法,调查了家长对孩子早期阅读重要性、阅读目的、阅读材料、阅读习惯
目的:分析18F FDG PET/CT定量分析在前纵隔肿瘤鉴别诊断中的初步应用效果。方法:选择广西医科大学第一附属医院PET/CT中心自2015年1月—2020年9月收治的78例前纵隔肿瘤患者作
目的:研究分析三维超声在女性盆底功能障碍性疾病诊断中的价值。方法:选取2018年12月—2020年8月我院60例盆底功能障碍患者作为此次研究对象以及研究主体,对60例患者进行会阴
游戏是幼儿园实现教育目标的重要途径,而影响游戏质量的关键因素之一就是游戏材料。在区域活动中,游戏材料与幼儿游戏质量存在直接的关系,它是幼儿游戏必不可少的一项载体。
评价黑苦荞胶囊降血糖功能,为黑苦荞保健食品开发提供依据。采用腹腔注射四氧嘧啶建立糖尿病小鼠动物模型。将试验动物分为模型对照组,低、中、高剂量组,同时设正常动物的空