基于深度学习的在线医疗咨询文本命名实体识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:atian_net
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展和普及,很多患者选择通过在线医疗网站,向医生咨询医疗健康相关的问题。利用信息抽取技术从患者的在线医疗咨询文本中自动地获取重要信息,然后从专业的医疗知识库中搜索答案,自动地为患者提供专业的医疗答复,这种方法能够有效地减轻医生的工作量。其中,命名实体识别是进行信息抽取工作的关键步骤。因此对在线医疗咨询文本进行命名实体识别的研究具有重要的现实意义。本文致力于基于深度学习的在线医疗咨询文本命名实体识别的研究,通过对相关研究现状的调研,发现当前存在以下问题:1)目前针对在线医疗咨询文本进行命名实体识别的研究,还处于空白阶段。2)在以字粒度进行实体标注的情况下,需要研究如何在模型中有效地融合字在句子中的局部特征和全局特征。3)目前鲜有同时使用双向语言模型和Mask语言模型的预训练特征,提高命名实体识别效果的工作。4)目前鲜有将语言模型预训练和多任务学习两种方法联合起来,提高命名实体识别效果的工作。针对当前存在的问题,本文进行了以下工作:1)构建了高质量的在线医疗咨询文本命名实体识别标注数据集,填补了当前针对该领域研究的空白。2)根据在线医疗咨询文本的特点,设计了MQNer模型。MQNer较好的学习到字在句子中的局部特征和全局特征,实验表明针对在线医疗咨询文本命名实体识别任务,MQNer能够取得良好的识别效果。3)在MQNer的基础上,创新性地设计了LM_MQNer模型。LM_MQNer同时使用双向语言模型和Mask语言模型对在线医疗咨询无标注文本进行预训练,然后将两种语言模型的预训练特征结合到模型中,从不同的角度获取到了无标注文本中蕴含的语法和语义信息。实验表明LM_MQNer有效地提高了命名实体识别的效果。4)在LM_MQNer的基础上,创新性地设计了基于对抗机制的多任务模型AMTL_LM_MQNer。AMTL_LM_MQNer不仅使用了语言模型预训练的方法,还使用了联合电子病历文本命名实体识别任务进行对抗多任务学习的方法。实验表明相比较于LM_MQNer,AMTL_LM_MQNer进一步提升了命名实体识别的效果。
其他文献
从1990年进入同济大学建筑与城市规划学院建筑学专业学习至令,一晃已是20余年。除去期间在柏林工业大学DAAD做访问学者和在麻省理工学院做访问学者等几次长长短短的出国访学
针对警情领域关键实体信息难以识别的问题,提出一种基于BERT的神经网络模型BERT-BiLSTMAttention-CRF用于识别和提取相关命名实体,且针对不同案由设计了相应的实体标记注规范
随着我国当今社会的快速发展,我国的科学技术在整体发展过程当中,越来越趋向于智能化,自动化。尤其是当我国社会在整体发展过程当中,步入到信息化发展时代,计算机技术,多媒体
中学与大学教学之间的主要差异表现在课本地位、教师作用、教学的目的、学生的学习状态和知识的教学方式等方面。学生只有充分认识中学和大学教学的差异,并积极主动适应大学
蔬菜大棚里的“除草机”─—鹅群浙江嘉善丁栅镇的蔬菜大棚内,几乎处处可见惹人喜爱的鹅群。据该镇农技人员介绍,鹅的天性食草,非但不会损害蔬菜,相反,养鹅能除草,促进蔬菜生长,一举
英语和汉语这两种语言因为思想和文化的差异而导致这两种语言的句法大不相同。笔者从功能语法、语篇的连贯与衔接方面来分析汉译英的文本,指出英语和汉语语篇中连贯衔接的不
该调查研究以昆明地区高校教师为例,讨论研究了高校教师工作压力与其产生来源的关系。全面系统的阐述了高校教师的工作压力和构成的影响,并在此基础上为当今高校教师提出相应
访谈嘉宾$$ 托马斯·皮凯蒂 法国著名经济学家,《21世纪资本论》作者。$$ 巴曙松 国务院发展研究中心金融研究所副所长,《21世纪资本论》中文版主要译者。$$ 解放书单
报纸
中学物理教学大纲(草案)的公佈,标志着我们的中学物理教学改革进入一个新的阶段。在这以前,徙从中央人民政府教育部成立以来,对于中学物理教学就进行过一系列的改革工作,从
水泥工业属于资源消耗型产业,消耗着大量的不可再生资源,如果能使水泥工业实现循环经济,将会使水泥工业为构建节约型社会做出贡献。本文阐述了水泥工业的生态循环体系、水泥