基于预训练BERT字嵌入模型的领域实体识别

来源 :情报工程 | 被引量 : 0次 | 上传用户:gdlcws
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗信息化的发展,越来越多的医疗信息被数字化的记录下来,这些医疗信息蕴含着丰富的医学知识。如何有效地提高提取和利用海量医疗文本信息成为当下医疗信息化发展的巨大挑战,针对目前医疗文本标注数据的不足以及医疗实体边界模糊的问题,本文提出一种基于大量医疗文献预训练的字嵌入语言表示模型。该模型利用大量的医疗文献对BERT模型进行预训练,从而得到EMRBERT模型,再通过EMR-BERT对训练文本进行字嵌入向量表示,将结果输到Bi-LSTM模型,最后利用CRF模型进行输出得到最终的结果。通过多组对比实验证明,EM
其他文献
各省、自治区、直辖市人民政府,国务院各部委、各直属机构:就业是民生之本,也是构建社会主义和谐社会的重要内容。党中央、国务院高度重视就业再就业工作,2002年下发了《关于进一
春节是我国重要的传统节日,有着千年历史,春节习俗的对外传播和发展也代表着我国文化的壮大和影响力。旧正是韩国春节,也称岁首、元日,既有着自古中国传承下来的风俗,也有本
期刊
每当看到垭口那棵巨大的黄葛树,就知道三百梯要到了. 上世纪90年代以前,公共汽车到歌乐山需要从牛角沱出发,经新桥、山洞上山,需要好几个小时,完全是长途绕行.所以当年我回歌
期刊
呕心沥血写出《红楼梦》的曹雪芹先生,说白了不过是个饿死的“扶贫”对象.所以,当我见到电视广告中突然冒出个“曹雪芹集团”时,竟然被吓得不轻. 据说如今专靠“研究”和“开
期刊
国务院日前印发的《关于新形势下加强打击侵犯知识产权和制售假冒伪劣商品工作的意见》强调,落实地方政府责任,将打击侵权假冒工作纳入地方政府绩效考核体系,加强对打击侵权
期刊
为了系统了解参考文献研究现状,促进参考文献著录规范化,完善参考文献著录标准。本文以CNKI中国期刊全文数据库中收录的参考文献相关文献为研究对象,应用信息计量学方法和社
大雪节气,微信朋友圈里自然是一番抒发,民俗画、风景画纷纷呈现,“塞北的雪”、刀郎的“雪”滚滚而来。我转发了老树画画“廿四节气 大雪”帖子,还写了感言:“围炉温酒夜读时。”  回味起清代蒙古族文学家哈斯宝说的话:“后日锦绣肺腑的贤哲之士读此《红楼梦》,案头必备高香清茶才应开读。点高香,是为报答作者写出这部如锦似绣的文章,留给我辈赏心悦目。沏清茶,是要洗涤我辈几天积下的愚心浊肠,赏心悦目,读此锦绣文章
期刊
幼儿期是一个人语言发展的关键时期。而语言是人类交际的工具,语言表达能力对一个人来说至关重要。特别是面对现代竞争激烈的今天,语言表达能力更是举足轻重,它可能制约一个人的
2016年,我甚至还没有听到天边滚过的雷声,这一年的日子就这样过去了. 那就趁2016年的天幕徐徐降落之前,来数一数天幕上还眨闪着的几颗星星.这几颗星星,都是我擅自命名的,这一
期刊