基于BERT嵌入BiLSTM-CRF模型的中文专业术语抽取研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:qq243396832
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升
其他文献
针对社交媒体中大量健康谣言的广泛传播现象,本文基于动机-机会-能力(motivation-opportunity-ability,MOA)模型对用户的健康谣言分享意愿进行研究,重点分析个体动机、机会和
由于信息技术革命,人类社会进入了"加速时代",经济与技术范式随之发生深刻变革。在新的经济与技术范式中,为实现创新驱动发展,知识与教育的地位将显著提升。当前面对信息技术
<正> 三、转基因食品 转基因食品又称基因改良食品,是在农业、畜牧业等领域运用基因重组技术对微生物、动物或者植物进行改良,从而达到提高产量、增加营养、抗病虫害等目的,
高职大学生具备进行社会实践的基本能力是理论课教学的必要的和有益的补充,是高职院校大学生在不断的接触社会,融入生活、服务人民群众的过程中切实地形成马克思主义的世界观
在系统梳理跨地域科研协作知识交流现状的基础之上,提出知识交流视域下跨地域科研协作发展态势及趋势分析的研究框架,以IS&R(information seeking and retrieval)等主题题录
英国学者对11000名儿童的一项跟踪研究宣告失败,该研究试图找出电子游戏与负面行为的关联。在无证据定罪的情况下,电子游戏被宣告无罪。该研究报告名为"电子游戏会影响儿童的
随着我国高速公路的飞速发展,路桥工程进入了又一个繁荣期,而且当前我国的各相关行业都对路桥结构的设计非常重视,路桥施工技术也日趋成熟。本文针对路桥工程施工中过渡段的
在工程施工过程中,将符合施工要求的技术流程标准制定好是工程建设管理的重中之重,同时也应将完善的考核体系建立出来,不断提高和改进施工工艺和施工技术,建立完善的项目质量
风痛宁贴剂质量标准的研究黑龙江中医学院刘介,李永吉(150040)哈尔滨建筑大学刘超英海拉尔农垦医院刘琦,乔秀华风痛宁贴剂是由青风藤、冰片等药物组成,具有祛风通络、散寒除湿、止痛作用
面对具有复杂性、综合性和交融性的重大问题,单一学科的理论和方法往往难以对其进行全方位的深入探讨和系统建构,交叉科学研究日益成为解决人类发展重大难题不可或缺的研究范