【摘 要】
:
目的:设计一种基于自然语言处理(natural language processing,NLP)技术的算法,用以从中文电子化病历(electronic medical records,EMRs)中提取肝细胞肝癌(hepatocellular carcinoma,HCC)患者的临床有用信息;并运用这些信息对患者进行HCC分期。材料与方法:从中文EMRs系统中收集92例HCC患者的临床资料,包括手术记
论文部分内容阅读
目的:设计一种基于自然语言处理(natural language processing,NLP)技术的算法,用以从中文电子化病历(electronic medical records,EMRs)中提取肝细胞肝癌(hepatocellular carcinoma,HCC)患者的临床有用信息;并运用这些信息对患者进行HCC分期。材料与方法:从中文EMRs系统中收集92例HCC患者的临床资料,包括手术记录、影像学报告和病理报告。我们将这些患者随机分为训练集(n=60)和测试集(n=32)。以人工注释的结果作为金标准,使用手术记录的训练集开发基于规则的算法和混合型算法。性能较优的算法将用于处理其他临床资料。通过计算精确匹配和部分匹配两种策略的准确度(precision,P)、召回率(recall,R)和F-score来评估算法性能。通过与人工分期结果相比较,对分期算法进行性能评估。结果:当基于规则和混合型两种算法处理手术记录的测试集数据时,其精确匹配和部分匹配两种策略的P、R和F-score均≥80%。基于规则的算法(其性能优于混合型算法)在处理其他三种类型的文档时,也均表现出良好的提取性能。当提取的临床有用信息用于HCC分期时,分期算法与人工分期结果的一致率可达75%。结论:基于EMRs成功开发出NLP算法用于临床信息提取和HCC分期,结果表明中文NLP技术在临床研究中具有潜在的应用价值。
其他文献
目的了解青海省卫生监督机构及卫生人力资源配置现状,为合理配置卫生监督人员提供依据。方法采用青海省卫生计生监督信息平台报告并导出进行分析。结果 55家卫生监督机构中职
<正> 我国玉器行业有一种特殊工艺,行话曰:“巧作”,此艺传之已久,明人称作:巧用”。它主要是指巧用玉材中不同颜色的斑点使其玉雕更加生动逼真。这种巧用玉色的作工近来称为
调度通信是GSM-R机车综合无线通信设备(以下简称CIR)的一个主要功能,实际使用时需要经常对CIR的GPS数据库进行维护。首先介绍了CIR的主要功能和工作原理,接着介绍了GPS单元和GP
目的1.构建肝脏特异性表达的微小RNA——miR-122的真核表达载体;2.将该重组质粒在人肝癌细胞系中转录,通过现代分子生物学技术鉴定其生物活性。3.利用该重组质粒初步探讨miR-
<正>《幼儿100》(教师版)杂志由中国教育报刊社·人民教育家研究院主办,是一本立足学前教育事业,关注幼儿园园长、教师、专家,关注儿童、家长的杂志。专业的成长首先是人的成
中国的区域文化由于长期大一统的社会格局使其具有自然与人为综合构成的独特性:既有以空间地域而定的“东西”“南北”和以文化品位而定的“华夷”“中外”一级地域文化的定义
《再保险通论》值得细读万里虹最近,笔者阅读了武汉大学出版社于1996年9月出版的《再保险通论》。觉得《再保险通论》一书很值得细读。主要是出于以下三种考虑:第一、作为一名保险从
分布式电源作为一种高效、可靠、经济的发电方式,近年来得到了国内外的广泛关注。分布式电源的快速发展给传统的电力系统注入了新的活力,同时也带来了新的挑战。多数的配电网
随着媒介传播技术的不断发展,媒介传播方式的不断更新,新的媒体出现了,手机电视、IPTV、移动电视等新兴媒体不断进入我们的日常生活,改变着我们接受信息的方式,影响着我们的
本文结合为某露天煤矿编制十年采矿计划的实践,介绍一种在二维地质模型的基础上,采用矿层特征图、变参扩张、质量控制和倒圆锥剥离等技术的计算机编排采矿计划系统。