基于领域词典与CRF双层标注的中文电子病历实体识别

来源 :工程科学学报 | 被引量 : 0次 | 上传用户：BCB

【摘要】

：

医疗实体识别是电子病历文本信息抽取的基本任务.针对中文电子病历文本复合实体较多、实体长度较长、句子成分缺失严重、实体边界不清的语言特点以及标注语料难以获取的现状,

【作者】

：

龚乐君张知菲

【机构】

：

南京邮电大学计算机学院、软件学院、网络空间安全学院,江苏省大数据安全与智能处理重点实验室

【出处】

：

工程科学学报

【发表日期】

：

2020年4期

【关键词】

：

中文电子病历医疗实体识别领域词典条件随机场注意力机制 Chinese electronic medical recordsclinical named

【基金项目】

：

国家自然科学基金资助项目(61502243.61502247.61572263),浙江省智慧医疗工程技术研究中心资助项目(2016E10011),中国博士后基金资助项目(2018M632349),江苏省高校自然科学基金资助项目(16KJB520003)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

医疗实体识别是电子病历文本信息抽取的基本任务.针对中文电子病历文本复合实体较多、实体长度较长、句子成分缺失严重、实体边界不清的语言特点以及标注语料难以获取的现状,提出了一种基于领域词典和条件随机场(CRF)的双层标注模型.该模型通过对外部资源的统计分析构建医疗领域词典,再结合条件随机场,进行了两次不同粒度的标注,将领域词典识别的准确性和机器学习的自动性融为一体,从中文电子病历文本中识别出疾病、症状、药品、操作四类医疗实体.该模型在测试数据中的宏精确率为96.7%、宏召回率为97.7%、宏F1值为97.2%

其他文献

超声乳化加人工晶体植入治疗葡萄膜炎并发白内障患者临床效果分析

目的分析超声乳化加人工晶体植入治疗葡萄膜炎并发白内障患者的临床效果。方法选取我院收治的葡萄膜炎并发白内障患者共35例,收治年限在2013年5月至2015年2月之间,将其通过抽

期刊

超声乳化人工晶体葡萄膜炎白内障

棉花新品种品比试验

棉花是阿克苏地区的主栽作物,在农民经济收入中占主要地位,为加快棉花新品种推广步伐,拓宽品种推广渠道,推进棉花品种和品质结构的优化,2015年,我站选择7个棉花新品种进行示

期刊

棉花新品种主栽作物中棉品比试验皮棉产量籽棉产量单株果枝数单株结铃单铃重果枝始节位

妇产科围手术期感染的预防与处理

随着抗生素的滥用、耐药细菌的急剧增加，为控制医院感染，合理使用抗生素问题显得尤为重要。理想的预防性用药是：最恰当的抗生素，最小剂量，最短疗程和最合适的给药方式，达到最佳疗效

期刊

妇产科感染

甜菜667米^2产5000千克滴灌栽培技术

裕民县位于塔额盆地西南边缘,属大陆性干旱气候,境内水、热状况差异大,造成作物种植品种单一。为提高抵御自然灾害能力,增加农民收入,拓展裕民县农业种植领域,自2013年开始,

期刊

栽培技术裕民县播种质量塔额盆地西南边缘技术总结叶丛深中耕种植品种滴水量

海绵城市专项规划编制技术思路与要点探讨——以天津市海绵城市建设专项规划为例

在我国快速城镇化过程中,不少城市建设被错误的政绩观所引导,对城市生态系统造成严重破坏、改变原有水文特征,频频出现内涝问题、水体生态环境急剧恶化,同时面临水资源短缺、

期刊

海绵城市专项规划技术思路天津

玉米品种对比试验

为筛选和鉴定第9师近年引进的玉米新品种的适应性、抗逆性、丰产性和稳产性,以加快玉米新品种示范、推广步伐,特安排本试验。二、参试品种及选育单位本试验参试品种共计8个,

期刊

品种对比试验新玉东单试验设计选育单位稳产性对比法半马齿型等行距穗部性状

基于领域词典与CRF双层标注的中文电子病历实体识别

与本文相关的学术论文