电子病历中临床术语的标准化研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:pigdd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历(Electronic Medical Record,EMR)已成为医疗机构工作中不可或缺的一部分,其中包含了临床发现、诊断、药物处方等重要信息。这些信息已被应用于临床决策、死亡率预测、药物不良反应分析等临床领域的自然语言处理研究上。然而,不同的医疗机构对电子病历的书写有着不同的标准,标准化电子病历等临床数据中的术语可以提高不同机构之间共享临床信息的能力,以及不同临床领域应用平台之间的互操作能力;并且可以提升数据的质量,有助于优化基于电子病历数据的机器学习模型。本文以2019美国国家自然语言处理挑战(National NLP Clinical Challenges,n2c2)发布的临床术语标准化任务为背景进行研究,该任务需将电子病历中的临床术语标准化为统一医学语言系统(Unified Medical Language System,UMLS)中的概念唯一标志符(Concept Unique Identifier,CUI),每条概念唯一标志符有着若干条字符串描述。本文针对临床术语标准化语料库的稀缺性与现有标准化方法难以解决同一语义不同词形的问题展开研究,具体研究内容包括:(1)提出了将临床领域预训练语言模型词特征迁移编码到孪生循环神经网络中的方法。传统的标准化研究使用特征工程结合机器学习的方法避免了对大规模语料的需求,但其需要对特征提取方法进行定义。孪生网络使用相同的子网络来处理相似的输入,适合于计算语义相似度,其在小规模的语料上表现好,目前还没有工作将其应用到临床术语标准化工作中。本文将临床领域预训练模型的词特征嵌入到孪生循环神经网络中进行临床术语标准化。通过对比实验对几种不同的预训练语言模型和不同的循环神经网络进行选择,并与常用的术语标准化系统MetaMap做对比,证明该方法在稀缺标注语料上的有效性。(2)提出了一种跨语言文本相似度计算的方法。由于UMLS词典规模非常大,一般先从中产生小规模的CUI字符串描述候选集。传统的候选集生成方法基于词形变体和共有词,不能解决同一语义不同词形表达的问题。本文提出了跨语言文本相似度计算方法,通过借助其他语言的语义对当前语言的语义进行比较。这种方法不仅能比较同义词,还有着词语增删、调整句子结构语序的效果。本文分别将基于单词字符的方法和基于词频-逆文本词频(Term Frequency-Inverse Document Frequency,TF-IDF)的方法应用在候选集的生成上,然后使用跨语言文本计算相似度的方法对候选集的选项做了补充或更新。通过对比实验证明该方法有效地提高了候选集的召回率,且提升了标准化的准确率。
其他文献
出口信用保险由中国人民保险公司独家试办以来,已经经历了三十余年的发展,现已成为我国经济转型升级发展过程中的重要力量。出口信用保险的种类从刚开始单一的短期机电出口信用保险,到后来开始逐步延长期限、扩大承保范围。出口信用保险的经营也逐渐多样化、规范化,形成了较为丰富的出口信用保险体系。随着出口信用保险的重要性不断被认识,经营出口信用保险的保险公司不断被认可,学者们也开始重视出口信用保险的现状研究和发展
在新课程理念下,课堂教学已经从“教师讲授型”逐步转变为“师生交流互动型”。科学有效的课堂理答是促进师生交流互动的催化剂,是教学过程中重要的一部分。课堂理答不仅可以促进师生对话,提升课堂教学质量,还可以调动学生参与课堂的积极性与主动性,实现生生对话。为实现有效的课堂理答,教师不仅需要具备一定的语言表达能力,还要善用教育机智,根据学生回答的不同情况,进行相应的课堂理答。本研究以小学英语初任教师作为研究
现阶段商品化的白光LED以GaN基蓝光LED激发黄色荧光粉的技术方案为主,其优势在于结构简单、价格低廉、制作工艺重复率高。然而其光谱中缺失蓝绿光和深红光光谱,使其与自然白光光谱相距甚远,显色指数不高,难以满足高品质照明的需求;同时荧光粉的老化问题也降低了白光LED的寿命和稳定性。因此,开发具有高显色性的单芯片全光谱白光LED成为了半导体照明领域的新热点。人们知道,InGaN材料的禁带宽度可从0.7
群体智能算法能够有效处理传统优化算法难以解决的优化问题,但随着求解优化问题的时间空间代价的巨幅增长,单机环境下使用群体智能算法求解,面临着计算时间过长等缺点。本文基于主流的Spark开源分布式计算框架,围绕群体智能算法求解组合优化问题展开研究。针对优化问题的高时间和空间复杂度问题,本文以置换流水车间调度作为案例研究,根据粒子群优化算法,蚁群算法,蝙蝠算法,萤火虫算法和灰狼优化算法等典型群体智能算法
目的:研究Pygo2参与乳腺癌发生发展与PMP22参与乳腺癌浸润转移的机制。方法:Pygo2的研究:在动物水平上构建MMTV-Pymt-K14Cre-Pygo2条件性敲除小鼠,通过拍照、MRI和CT观察肿瘤发生与肺转移情况,解剖肿瘤进行Real-Time PCR以及Western Blot寻找Pygo2抑制肿瘤发生的机制,检测乳腺干细胞比例;在细胞水平上取肿瘤原代细胞以及正常乳腺上皮细胞诱导癌变后
当前,毒品问题已经成为严重威胁人类社会发展的世界难题。随着国内外智慧建设不断推进,传统戒毒治理模式逐渐被打破,智慧戒毒的概念应运而生,并逐渐成为学术界和实践领域研究的重要课题。本文目的是在国内外智慧化建设迅猛发展的背景下,构建出具有新时代特征的智慧化戒毒系统治理模式。作者采用文献研究法、个案研究法、访谈法等方法,通过对国外和国内关于智能到智慧的必然发展趋势,智慧化建设的优势及影响因素,治理特征,国
目前,中国的成人教育学科体系虽然已经形成了较为完整的体系框架,在理论与实践研究方面拥有了一系列突出的成果,但在实际的研究结果中却始终难以明确成人教育学科体系动态变化的特征,不仅如此成人教育学理论研究符号显性的不足与“成人教育”符号话语权在我国教育政策范围内的逐渐退出也影响着未来成人教育的发展局势。从纵向的发展来看,成人教育学几乎以无所不包的姿态将所有与成人相关的问题与现象涵盖进去,研究内容与方向虽
多肽超分子相互作用是维持生物大分子的二级结构和酶-底物识别作用等生命体内生物化学反应的前提基础。探索多肽超分子相互作用在分子尺度的电荷传输过程不仅能够深入理解有机体内复杂的信息传递过程,并且可用于指导生物医药产品研发,对设计高生物活性的多肽分子和制备基于多肽的分子器件都具有重要的参考价值。然而,现阶段多肽分子的电荷传输机理仍存在诸多争议,主要体现在理论计算结果和单分子电学表征实验的差异上。此外,基
进入21世纪,互联网已成为人类新的生活空间,它架起了跨越地理空间的通路,让世界变成了一个“地球村”,给人类互联互通带来了极大便捷。随着互联网的广泛普及,儿童已成为当下网络参与的重要群体之一。不可否认,互联网在拓宽儿童学习、娱乐渠道、强化儿童权利意识、促进儿童自身发展等方面发挥着积极作用;但另一方面,由于互联网保护机制尚不完善,各种不良信息充斥其中,容易给儿童带来侵害。实践中,儿童已越来越有能力在没
作为政府公共管理的重要内容,统计肩负着客观呈现经济社会发展情况、全面展示国情国力、准确揭示经济运行规律的重要职能,是一种典型的公共产品。昆明经济技术开发区既是国家级经济技术开发区的重要一员,又是云南省最主要的产业聚集区和经济建设主战场,做好统计工作意义重大。为进一步服务产业经济发展,结合自身的特点,昆明经开区逐步探索建立了统计工作体系,但随着全区管理范围和经济总量的逐步递增,再加之外部环境刺激,全