基于CNN-BLSTM-CRF模型的生物医学命名实体识别

来源 :第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会 | 被引量 : 0次 | 上传用户:bleachji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是自然语言处理任务的重要步骤.近年来,不依赖人工特征的神经网络在新闻等通用领域命名实体识别方面表现了很好的性能.然而在生物医学领域,许多实验表明基于领域知识的人工特征对于神经网络模型的结果影响很大.因此,如何在不依赖人工特征的情况下获得较好的生物医学命名实体识别性能是有待解决的问题.本文提出一种基于CNN-BLSTM-CRF的神经网络模型.首先利用卷积神经网络(CNN)训练出单词的具有形态特征的字符级向量,并从大规模背景语料训练得到具有语义特征信息的词向量,然后将二者进行组合作为输入,再构建适合生物医学命名实体识别的BLSTM-CRF深层神经网络模型.实验结果表明,不依赖任何人工特征,本文方法在BiocreativeⅡGM和JNLPBA2004生物医学语料上都达到了目前最好的结果,F-值分别为89.09%和74.40%.
其他文献
<正>八宝酱菜就是选用八种以上蔬菜,经加工腌(酱)制而成的风味小菜。八宝酱菜因所选用的蔬菜各具特色,因而其成品脆、嫩、爽、香、辣、甜俱佳,堪称爽口开胃上品,深受人们的喜
<正>由中国文学艺术联合会、中国舞蹈家协会主办的第六届中国舞蹈节·第十届中国舞蹈"荷花奖"当代舞、现代舞评奖活动于2016年11月1日至2日在北京民族剧院举行。作为中国舞蹈
目的对148例骨结核合并糖尿病患者的围手术期护理进行分析与探讨。方法选取我院2012年6月~2014年6月收治的148例骨结核合并糖尿患者作为本次研究的对象,在围手术期采取饮食护
目的探讨肺炎支原体(MP)肺炎患儿合并心肌炎的临床特点。方法对72例MP肺炎患儿的心肌酶谱及心电图(ECG)的变化进行动态监测,并予以分析。结果心肌酶谱血清肌酸激酶(CK)、肌酸
<正>电网安全涉及的环节较多,在电力建设中,大量开关站、环网柜、电力电缆投入使用,加上老城区一些年代久远的架空线路,造成供电网络复杂、分支繁多,形成了配网中许多的合环
<正>肺癌为临床常见、多发恶性肿瘤之一,目前国内肺癌发病率仍居首位,并呈逐年上升趋势[1],70%—80%的患者在发现时已是晚期,化疗是肺癌治疗的最常用手段[2],而化疗药物引起
目的测定2010年版中国药典中收载10种海洋天然药物中5种重金属的含量。方法采用电感耦合等离子体质谱法。结果所测10种天然海洋药物均含有重金属。结论本方法简便、快速、准
福建沿海地区(福州、莆田、泉州等)广泛分布着淤泥及淤泥质土等软土。软土的特性,增加了福建软土地区的基坑设计和施工难度。尤其是开挖深度在4~6m范围内的浅基坑,由于开挖较
本文介绍国家第三批、第四批名老中医学术经验继承指导老师陈宝贵教授的临证用药思路。
文中介绍了应用于电信网监测管理系统中一种高速数据采集硬件的设计与实现,该接口板主要采用DSP和FPGA来完成如下功能,能对接收的信道内容进行初步判别,如语音、传真、VBD等