基于深度学习的中文电子病历实体及其修饰识别技术研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:yogonet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智慧医疗是当前人工智能领域的研究热点,而在各种医疗数据中,电子病历具有重要价值。电子病历是医务人员通过电子病历系统在医疗活动过程中产生的一种临床文本信息,是一种记录患者信息的数字化信息。通过对电子病历的分析与挖掘,可以得到大量的与患者密切相关的医疗信息,这对临床决策能起到很大的帮助。自然语言处理技术可以帮助我们实现对电子病历文本信息的挖掘,如命名实体识别、实体修饰识别等技术。其中实体识别旨在识别出病历中不同实体的实体边界与类别,实体修饰旨在识别出特定实体与患者之间的修饰关系。但是与其他文本相比,中文电子病历存在大量包括书写不规范、专业术语较多、特殊字符频繁、句子结构不完整等问题。同时,由于涉及到患者的隐私,导致目前开源的电子病历数据不多。这些问题加大了对电子病历的信息进行挖掘和识别的难度。因此为了更好地对电子病历信息进行抽取,本文利用深度学习方法在自主标注的数据集上对中文电子病历的医疗实体与修饰识别及其联合识别技术进行了研究:(1)基于知识注意力机制增强的实体识别。虽然以往的相关工作都取得了较好的成果,但是却忽略了能够提供丰富实体信息的外部医疗知识,因此本文提出了基于医疗知识注意力增强的CNN-BLSTM-CRF方法。通过使用注意力机制,对医疗词典中的医疗实体的定义与边界信息进行编码,来增强神经网络模型的性能。其中,在BLSTM对文本信息编码前,先用CNN预先提取了文本的字级别表示并作为文本信息的补充信息,有效地解决了上文中提出的电子病历存在的书写不规范和特殊词频繁等问题。(2)基于CNN-GRU神经网络的实体修饰识别。使用了 GRU网络对电子病历文本信息进行了编码,并使用Softmax进行解码。其中,GRU网络是循环神经网络(RNN)一个变体,与之相比GRU更好地解决了远距离依赖的问题且计算方式更简单。同时使用了 CNN网络预先提取了字符级表示以解决书写不规范和特殊字符频繁等问题。(3)实体及其修饰联合识别。在联合识别任务中本文提出了一种基于多标签方案的联合识别方法,并使用BLSTM-LSTM模型进行识别。与传统的串联式识别方法相比,基于多标签方案的方法,可以成功的将两个步骤转换为一个步骤:通过多标签方案,使用端到端模型一步识别。实验结果表明,在相同的数据集上,本文的方法相较于其他方法取得了较好的性能。
其他文献
思想政治教育话语方式是思想政治教育话语主体在社会主义意识形态指导下,在何种场域、运用何种方式描述何种内容的意义表征系统,是关涉思想政治教育吸引力与感染力,进而影响
目的探索工作坊培训模式在中医护理方案培训中的应用。方法选取2016年7—9月我院外科140名护士作为研究对象,将其随机分为对照组和观察组,每组各70名。对照组按传统理论授课
<正> 前言为适应各工业部门对净化过滤设备和材料的新要求,我厂在1968年开始了耐化学腐蚀性能好、耐高温、强度高、使用寿命长的新型微孔陶瓷制品的试制工作.
为了解决水体富营养化和底泥污染的问题,人们开展了大量的研究和实践工作。其控制与防治也从控制排放、污水改道等外源营养物控制到减少内源营养物负荷,针对受污染水体和底泥
通过对相关史料的分析,论证了翠华山主景区崩塌堆积不可能是唐天宝年间地震诱发山崩形成的。通过实地考察,认为这些崩塌堆积不是同时发生,而是多期崩塌活动的结果,并且崩塌活
目的:探讨64层螺旋CT冠状动脉成像质量的影响因素和临床应用价值。方法: 398例行64层螺旋CT冠状动脉造影扫描,根据不同心率应用不同扇区重组,数据传入后处理工作站进行图像重
在当今工业化、城市化的进程中,全球经济社会发展迅速,由此带来了生态环境的急剧恶化。如何保护环境,让生态资源得以永续利用,是全世界都在研讨的重要课题。环境公益诉讼是保护环境的重要司法手段之一,而我国是近几年才从立法上完全确立了环境公益诉讼制度,相关案件数量也有小幅度提升。在已审结的案件中,出现了很多法律尚未明确规定的新问题,如法律责任承担方式、诉讼费等费用承担、举证责任等,这些问题的出现一定程度上影
调查了沈阳彰驿地区低温平菇害虫的种类及其发生规律,为平菇虫害防治提供理论依据。利用黄板诱集方法定时收集菇棚内有害成虫数据,鉴定成虫种类,采用Excel、SPSS22.0软件统计
目的 对驱虫斑鸠菊药材的质量标准进行研究.方法 采用薄层色谱法对驱虫斑鸠菊药材中的黄酮进行鉴别,采用紫外分光光度法测定总黄酮含量.结果 建立驱虫斑鸠菊药材薄层色谱鉴别
曼斯菲尔德的短篇小说《布里尔小姐》是短篇小说中的艺术精品。作家突破传统小说的写法,淡化了情节,将笔触直接深入主人公的内心深处,采用作者型叙述声音,通过叙事视角的不断