基于深度学习的医疗命名实体识别方法研究

来源 :齐鲁工业大学 | 被引量 : 3次 | 上传用户:dolan525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是自然语言处理领域中一项非常基础的任务,在机器翻译、问答系统等众多自然语言处理任务中有着广泛的应用,其准确率直接决定下游任务的效果。医疗命名实体识别指从医疗文本中识别出特定的医疗实体,是智能医疗、医疗知识挖掘、医疗临床决策支持系统等高层应用的基础工作,具有重要的理论研究价值和实际应用前景。由于国内医疗命名实体识别技术起步较晚,现有相关工作存在多方面的局限性,因此本文试图将如今较为先进的深度学习模型进行整合,开展医疗命名实体识别相关研究,主要工作和贡献体现在下述三个方面:(1)提出了一种基于堆叠神经网络的医疗命名实体识别方法。因为医疗领域的文本有很强的专业性,传统模型的方法并不能很好的识别边界模糊的实体;并且医学文本通常比较长,信息存在远距离的依赖关系,单层的神经网络难以提取远距离的特征。针对此问题,本文提出了一种基于堆叠神经网络的医疗命名实体识别方法,利用多层堆叠的双向循环神经网络对医疗文本进行编码,使用条件随机场选取最优序列标注路径,提高命名实体识别的准确率。(2)提出了一种基于膨胀卷积神经网络的医疗命名实体识别方法。考虑到卷积神经网络应用在命名实体识别任务时,会忽略先前的输入;如果简单叠加卷积神经网络,更多提取的是局部信息,不能获取长句的特征。针对此问题,本文提出一种基于膨胀卷积神经网络的医疗命名实体识别方法,利用膨胀卷积神经网络来解决捕获特征不全面的问题,并且对数据集添加特定的特征词,从而提高医疗专业领域的实体识别效果。(3)提出了一种基于BERT预训练的医疗命名实体识别方法。本文考虑在词表示方向做出进一步优化,设计了一种基于BERT预训练的医疗命名实体识别方法。由于传统词表示方法存在静态的词表示不够灵活、特征抽取器的选取不佳、单向语言模型影响效果等问题,本文选择采用BERT预训练的字向量来代替传统词向量表示,为CRF网络提供足够的先验知识(语法、词义等信息),从而提升医疗命名实体识别效果。
其他文献
随着中国人口数量的逐年增加和消费倾向的改变,人们对于猪肉制品的需求量也在逐年增加。猪腹剖切工序作为重要的屠宰加工环节,存在人工作业效率低、劳动强度大、工作环境恶劣
自改革开放后,人们对于精神文化方面的追求与以往相比有了一个质的飞跃。绘画艺术作为精神文明领域中的一个重要分支,占据着重要位置,深受大众喜爱。而岩画将绘画艺术与雕刻艺术巧妙融合在一起,它是人类早期反映生活反映世界的一种抽象性表述,是人类祖先留给后人的珍贵精神产品,凭借艺术的语言来打动人心。我国对于岩画的研究仅有30多年的历史,并且将关注的重点放在岩画基础信息整理、制作年代考究与艺术风格体现上,从而忽
党的十八大以来,随着全面从严治党不断向基层延伸和乡村振兴战略的全面推进,城乡融合发展的力度逐步加大,各类涉农资金和资源密集“下乡”,村干部手中的“小微权力”的“含金量”逐渐增大,村干部的履职风险也越来越高。如何加强乡村治理,走乡村善治之路,是国家治理体系和治理能力现代化建设面临的新挑战。近年来,温州市瓯海区以“清廉村居”建设为主要抓手,在清廉建设实践中不断创新机制、规范管理、挖掘文化,取得了一定成
海域在发挥资源效益的同时,作为发展海洋经济的基础和载体,也面临着诸多问题。特别是近几年不少单位和个人盲目追求经济利益,加重了对海洋资源的索取,在此背景下,就使得非法
目的:胃癌的形成、发展是一个缓慢、复杂的炎癌转变过程,一般沿着“慢性非萎缩性胃炎→慢性萎缩性胃炎→肠上皮化生→异型增生→胃腺癌”方向发展,其中不完全肠上皮化生与异
宁浩作为第六代导演的领军人物,出身于草根。他既能从丰富的阅历中汲取灵感,确保故事的结构和情节的丰富性,又深谙受众的审美习惯,能准确地抓住观众的审美倾向,满足他们的审美需求。他的成就不仅表现在获得电影票房的商业成功上,更表现在对中国电影格局的影响上。宁浩用自己小成本投资的电影让草根阶层文化赢得了大众的认可,颠覆传统的电影拍摄手法,构建了他独有的审美特征。笔者意图通过研究宁浩的电影创作,探求他对中国电
港台地区的同志题材电影经过半个多世纪的发展,在数量上已经有数百部之多,并形成自身独特的创作范式,许多优秀作品还不断在国际电影节上获奖。本文以21世纪港台同志题材电影为研究对象,研究这些电影的审美特征,深入分析港台同志题材电影的创作手法和艺术内涵,揭示港台同志题材电影的审美内涵。本文先是阐述了21世纪港台同志题材电影的概念、产生语境、发展历程;接着分析了新世纪的港台同志题材电影在叙事上所表现出来的突
物料输送在现代多种工业活动领域都有非常多的应用,特别是在矿产开采领域更是有非常重要的意义,而在散料输送方面,带式输送机无疑是最为常用的输送设备,相比于其他的车辆类输送设备,它的运输量大,结构简单,而且安全可靠。现有的带式输送机设计方法都是基于静力学理论而来,而对于长距离、大运量的带式输送机,这种设计方法已经不能满足工程需要,因此非常有必要进行带式输送机的动态特性分析。而本文的主要研究内容即是带式输
全口义齿是牙列缺失最主要的修复方式之一,也是口腔修复中的一项重难点。随着科技和材料的不断升级,数字化技术在全口义齿修复中起到了很大的辅助作用,数字化技术主要应用在
民俗文化旅游区景观能够较好的展示区域的文化内涵,传承和发扬区域民族特有的民俗文化。从2016年岫岩满族自治县被列入国家全域旅游示范区创建名单中开始,岫岩就结合自身满族文化特色地域背景来全力发展自身的旅游业,在此背景之下本文以岫岩玉龙山满族风情旅游区作为研究对象,结合景观叙事学等相关文化景观设计理论与相关工程案例,对其进行叙事性的景观设计研究。本文首先对研究涉及到的民俗文化旅游、文化景观、景观叙事学