结合注意力机制的Bi-LSTM-CRF中文电子病历命名实体识别

来源 :计算机应用 | 被引量 : 2次 | 上传用户:zhubajie527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中文电子病历命名实体识别任务中,为了消除传统命名实体识别方法高度依赖人工提取特征这一不足,设计了双向长短时记忆(Bi-LSTM)网络与条件随机场(CRF)结合的网络模型,并在联合网络的基础上添加注意力机制,从而优化实体识别准确率。首先,将中文电子病历数据集进行脱敏处理及序列标注等预处理;其次,结合词嵌入技术将电子病历文本序列进行词向量化表示,并利用Bi-LSTM网络模型构造包含前向和后向文本的语义特征;然后,将双向特征序列输入到注意力层,利用注意力机制对文本特征向量的语义编码分配不同的注意力权重,
其他文献
广西壮族自治区是中国五个少数民族自治区之一,也是中国—东盟博览会的举办地。区内民族文化丰富多彩,民族语言各具特色。在这片民族文化资源丰厚的热土里,少数民族题材电影
在这样一个信息时代,广播电台作为最早出现的媒体仍然快速发展着,听众对广播的质量有着相对较高的要求,广播电台编辑在工作中扮演着重要的角色,为听众提供大家感兴趣和与其相
针对移动机器人平台上的双目视觉深度信息获取问题,研究了一种适用于动态图像序列的双目图像立体匹配算法.采用成熟的半全局立体匹配算法对图像快速立体匹配;分析了在复杂环
近年来,新媒体的异军突起改变了以往的传播语境,传统电视用户的转移、信息发布的即时以及影音制作内容的多样,纷纷成为推动电视媒体加速媒介融合的驱动力。本文将探讨地方电
轻暖绣缝轻暖绗缝面料在气候变化地驱动下成为重点材质品类,与以往不同,商休化、套装设计以及拼接是本季主要的创新模式,多元化线迹和充绒状态丰富服装细节,除传统羽绒服、棉
虚拟演播室技术是新型的电视节目制作方法,建立在传统色键抠像技术应用基础之上,采用三维图形以及视频合成等现代技术手段,基于摄像机参数及其位置使虚拟场景透视关系与前景
消费由“升级”转向“分级”,迭代变化朝着更为理性和符合当下环境的方向发展。绿色、回归、极趣成为2020/21秋冬季节的关键方向,带来具有现代感和可持续性的探索与创新。从
基于核范数的低秩矩阵近似模型,由于对所有奇异值的惩罚力度一样,导致不能很好地反映原矩阵的特性,针对此问题提出了带初始值引导的加权核范数最小模型。首先,通过构造和奇异值的大小相反的权值,使得近似矩阵能够很好地逼近原矩阵;其次,改进线性搜索加速近端梯度算法(APGL),提出了求解加权核范数最小模型的APGL-WNNM算法;然后,使用适当的预估方法,构造初始引导矩阵,来提高算法的收敛速度;最后,证明了新
本报讯(记者 魏宁)2010年徐州市人才发展统计公报近日正式发布,这在我市尚属首次。$$ 2010年,全市围绕建设创新型城市,实施“科教与人才强市”战略,统筹推进人才强市“八大工程
报纸
小麦是阳谷县主要的农作物之一,近年来在气候变暖趋势下小麦易发生冻害,给小麦生产带来了很大的影响。从气候条件、品种、播种时间等方面分析了小麦发生冻害的原因,并从选种