非结构化医学病历信息抽取的方法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:f654753936
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗领域的数字信息化在科技与大数据的发展中正在不断被推动进步着。它的运营模式愈发转向电子病历,并以电子病历作为重要的信息资源,结合先进技术进一步挖掘探索,使得我国医疗事业不断完善。这些医学病历记录了病人在就诊期间的详细记录,涵盖了丰富的医学知识,可以给病人或医生提供查询及决策支持,也给之后进一步的医学研究奠定了数据基础。但是经调研,约80%的医学病历是处于非结构化状态的,难以直接被利用而造成了大量医学资源浪费。为了解决这样的问题,本文就医学病历非结构化的特点,对其进行信息抽取方法的研究,主要分为以下三个方面:(1)运用自然语言处理(Natural Language Processing,NLP)技术,提出一种基于逻辑标注策略的实体与关系联合抽取的方法完成信息抽取任务。通过几种常用序列标注模型的对比结果,确定本次研究所使用的模型为基于逻辑标注策略的Bi-LSTM-CRF。在600份医学病历、41类标签的情况下得到的F1 score为76%。在完成实体与关系的联合抽取后,最终基本实现了医学病历文本知识从非结构化到具有逻辑推理结构化的转变。(2)运用Neo4j图数据库存储抽取的信息,采用图表示的方法构建以疾病为中心的医学知识图谱。对抽取到的结构化信息进行可视化,同时考虑后续怎样以医学知识检索推理的方式将构建的知识图谱应用于实际场景中。(3)疾病预测与健康推荐系统的模型设计。在完成非结构化医学病历信息抽取后,我们将其应用于实际应用场景来实现医学病历信息抽取的价值。这个系统针对新输入的非结构化病历文本,分为预处理、基于疾病为中心的知识图谱的搜索匹配、合理性评估三大模块,最终给出相应的疾病预测和健康推荐。为了评估本次医学病历信息抽取在疾病预测与健康推荐系统这样的实际应用场景中取得的效果,我们已经将该系统应用于福建省近1000个乡镇的基层诊所中并通过收集医生在使用过程中的反馈来评估系统疾病预测的能力。最终对比系统预测得到的疾病与专业医生校正的数据集中对应疾病的一致性,可以得出在常见疾病的预测上,系统的预测准确度几乎能达到90%以上,证明了该系统在一定程度上能够辅助医生进行疾病的推测。
其他文献
相比于过去的教学来说,目前高中阶段的语文古诗词课堂教学,在教学观念、教学内容、教学形式等层面,都产生了翻天覆地的变化。因此,文章以高中语文古诗词教学实例,据高中语文
在城市建成区内,大面积的城市公园、广场的建设越来越难以为继,一味地注重大面积、大规模的绿地项目建设变得不切实际。在城市发展的过程中,城市中的绿地在逐渐减少,开始出现破碎化的趋势,城市绿地空间正在经历从大到小的演变过程。另一方面,快节奏的生活使人们对良好的居住环境,充足的休闲绿地的需求与日俱增,与居民日常工作生活联系更加紧密的小空间越来越不容忽视。因此,本文就“小尺度空间的景观设计策略”为论题,做了
海南鳽(Gorsachius magnificus)隶属于鹈形目(Pelecaniformes)鹭科(Ardeidae),为我国Ⅱ级重点保护野生动物。本文报道了2019年5月至9月海南鳽在贵州雷公山自然保护区干脑村南
随着市场经济体制改革的不断深入,水电项目对概预算的要求越来越高,通过对现行适用于水水电行业定额体系及标准使用现状的梳理,找出当前水电定额体系及计价模式在使用过程中
定额作为计算工程消耗量的依据,是合理控制造价的依据,是国家加强宏观调控的管理手段和依据,也是造价管理的基础工作。但由于抽水蓄能电站建设及运行还存在一定的特殊性,使得
通过总结回顾无人机地面站系统架构的发展历史和现状,根据不同形态控制站的发展思路和技术路线,针对无人机典型运行场景分析,以及自主作战、体系化协同作战等核心作战构想及
2010年6月3日,夏季雷暴同往常一样从大西洋向内陆席卷而来,狂风在佛罗里达的航天海岸呼啸。天空忽然打开一道缺口,暴雨倾斜而下,卡纳维拉尔角部分地区的降水量达到了每小时3
众所周知,3D全息投影技术乃当今时代信息技术发展中的产物,其具备了各种各样的优点,如立体感、视角广等,为人们的视觉带来了新的感受,促使信息采集和传递变得愈发快捷且高效
随着我国人们生活水平的进步,旅游业逐渐盛行,旅游景点中充满地域特色和人文特色的民宿,也逐渐发展起来。在民宿室内外设计中采取3D全息影像技术,能够提升民宿的设计感,满足
作为一种量化目标导向的节能标准,德国被动房标准问世以来,对全世界产生了深远影响。我国被动式超低能耗建筑的相关标准就是在被动房标准的启发下,根据国情进行调整演化的产