基于创伤大数据的创伤失血性休克伤情预测预警模型建立研究

来源 :中国人民解放军医学院 | 被引量 : 0次 | 上传用户:liwang0113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的本研究通过数据检索技术从海量创伤数据中抽取创伤失血性休克伤员数据,通过智能筛选方法提取创伤失血性休克关键指标,进而应用机器学习、深度学习算法对时序数据进行分析及模型验证,能对创伤失血性休克进行预测预警,对模型性能进行客观评价,提高医护人员对该并发症的提前感知能力,实现早干预、早治疗,改善伤员预后,并为其他应用大数据技术开展类似临床决策支持研究提供一定参考。方法:(1)应用数据检索技术从MIMIC III数据库中提取创伤失血性休克伤员数据,使用粗糙集算法对包含伤员生命体征、血常规、血气分析、凝血功能、血生化、尿常规的庞大指标数据集进行解析;进而使用元胞遗传算法进行独立重复实验,根据指标在筛选中被保留次数判定其识别能力,进而形成新的关键指标集。(2)根据被筛选出关键指标对伤情识别能力不同,即被筛选保留次数不同,对关键指标进行重组及分组,以时间序列性关键指标为分析对象,去除补缺后不能满足研究需求的指标。分别应用机器学习中的逻辑回归、支持向量机、朴素贝叶斯和AdaBoost对创伤失血性休克结局变量进行预测,对分类器模型性能进行评价,分别获得不同分组指标集下各种算法所计算出的准确率、召回率、精确率、F值,并对结果进行比较。(3)分别使用MLP和GRU两种神经网络模型,使用创伤失血性休克伤员阶梯式关键指标,即分为仅生命体征、生命体征+血气分析和生命体征+血气分析+血常规共三种不同指标组合,设置时间跨度为1小时,调整时间步长,使模型表现最优,对模型性能进行评价,获得不同分组指标集下各种算法所计算出的准确率、召回率、精确率、F值,并对结果进行比较。(4)以解放军总医院急救数据库中满足研究条件的创伤伤员数据对已建立模型性能进行客观验证,获得外部验证结果,并与内部验证结果进行实际比较,探讨模型在其他数据集中的泛化性能。结果:(1)应用元胞遗传算法进行10次独立重复属性约简试验,约简保留10次的关键指标为呼吸频率和白细胞;约简保留9次的关键指标为天冬氨酸·氨基转移酶;约简保留8次的关键指标为PC02、PH、体温、尿比重;约简保留7次的关键指标为血浆纤维蛋白原测定、收缩压、舒张压;约简保留6次的关键指标为国际标准化比值、乳酸、氯化物、葡萄糖、心率。共发掘出10组最优的关键指标组合规则。(2)将待分析时间序列指标分成包含全部指标、13个关键指标、8个关键指标、6个关键指标的共4组数据集,分别应用4种机器学习算法进行预测分析。当应用全指标数据集时,AdaBoost方法,在准确率、召回率、精确率三方面均超过90%,表现优于其他三种方法;在应用不同数量关键指标数据集时,AdaBoost在应用于包含13个关键指标的数据集时,F1.5值达到90.1%;应用于全数据集时,F1.5值达到91.8%,在4种算法中表现最优。(3)使用GRU和MLP两种神经网络模型分别在三组不同的预测预警指标数据集上进行预测,当时间跨度为1h且时间步长为5时模型表现性能最优。其中,应用GRU进行创伤失血性休克预测时,单独使用生命体征预测的F1 5值最高可达85.1%,当保证F1.5值不低于80%时,可提前2小时预测创伤失血性休克发生;使用生命体征和血气分析指标进行预测时,F1.5值最高可达86.3%,当保证F1.5值不低于80%时,可提前3小时预测创伤失血性休克发生;使用生命体征、血气分析和血常规指标进行预测时,Fi 5值最高可达90.1%,当保证F1.5值不低于80%时,可提前4小时预测创伤失血性休克发生。在使用相同指标、提前相同时间时,GRU的F1.5值均高于MLP,表面前者性能优于后者。(4)通过外部验证,AdaBoost模型在内部验证和外部验证中均取得了较好的表现性能,具有较好的鲁棒性,其F1.5值最高达0.892,与外部验证结果最为接近;深度学习算法泛化性能欠佳,仅在准确率方面与内部验证结果接近。结论:(1)关键指标筛选是开展创伤失血性休克预测预警,提高模型预测效能的重要基础,也是尽可能减少需求指标数量,优化模型的重要措施和手段。(2)使用机器学习方法能够较好地对创伤失血性休克是否会发生进行预测。当应用关键指标集预测时可能存在最适指标组合,需综合考虑指标采集的经济效益和时间效益。(3)使用深度学习对创伤失血性休克进行预测预警,引入预测时间窗,提出预测指标阶梯化概念,当仅使用可实时监测的指标且应用算法能获得较好的预测效能时,在理论上就能对创伤失血性休克实施实时动态预测预警。(4)通过外部数据集验证是检测模型综合性能和泛化性的有效方法,使用筛选获得核心关键指标时模型的泛化性能较好,说明应用元胞遗传粗糙算法筛选关键指标对于提高模型性能方面的具有重要的应用价值。总之,通过系列研究,获得了多种能够为临床创伤伤员进行失血性休克预测预警的模型算法。下一步的研究重点是进行严密的临床验证,对实际预测效果进行严格测试,不断对模型进行优化改进。
其他文献
挫折和失败是我们每个人在一生中必须面对的负面情绪状态,婴幼儿也不例外.尽管家长们对0-3岁的婴幼儿呵护有加,然而因为这个阶段的孩子的生存能力有限,所以他们更容易遭受失
云南省是一个农业大省,但在发展农业的同时,现在云南不同地区已经出现了资源枯竭、水土流失、生态恶化等发展伴生问题。如何更好利用云南省的资源优势,同时在发展过程中不以
当今,谈论戏曲,总绕不开传承和创新的话题,在飞速发展的时代,人们更多关注的也许是戏曲的创新,然而,从表演的角度来看,对戏曲优秀传统与优秀经典的传承,既迫切也很重要,对于创新,要在继
报纸
通过对6根方钢管自密实混凝土纯弯试件的试验研究,考察了方钢管自密实混凝土的纯弯力学性能。采用数值计算的方法对方钢管自密实混凝土纯弯试件进行了受力全过程分析,并和实
语码转换是我国大学英语课堂上普遍存在的一种现象,该文在美国语言学家克拉申(Krashen)的可理解性输入假说的理论基础上分析了语码转换在大学英语课堂上的积极意义,初步验证
我国古代《周礼》载:“医师掌医之政令,聚毒药以供医事,凡邦之有疾者、疮疡者造焉。”又《尚书》内有“若药弗瞑眩,厥疚弗瘳。”说明了治疗常见病的药多是非剧即毒。因人身
目的:探讨在治疗严重急性呼吸综合征(SARS)中,抗病毒药物的应用对糖皮质激素用药时间的影响.方法:采用临床流行病学回顾研究,分析我院住院SARS患者90例的临床资料.90例患者分
盐碱地普遍存在盐碱重,返盐强烈,盐分垂直变化明显等问题,造成土壤产出率低且不稳,农业经济效益不高,成为了影响农业生产的主要限制因素之一。当前有关土壤盐分空间分布特征
本文巧妙地应用假设法和极端判断法讨论了U型玻管向前(或向后)倾斜直到倒置及向左、向右倾斜时水银柱的移动方向。