基于ICU临床数据的脓毒症早期预测算法及其可解释性研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:lx305954308
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
脓毒症(Sepsis)是一种由于人体免疫系统对于感染的反应失调所引发的多种组织损伤、器官衰竭甚至导致死亡的致命疾病,其发病率与死亡率在全球范围内均居高不下。对于脓毒症可靠的早期发现至关重要,研究表明,如果脓毒症患者得不到及时的治疗,其器官损伤程度和死亡率都将大幅上升,对患者健康造成不可逆的危害。目前,在对重症监护病房(ICU)患者的治疗过程中,实现脓毒症发作时间的早期预测仍是一项重大挑战。同时,现有的研究工作虽然提出了多种适用于该问题的AI模型,但其模型不具有可解释性,难以满足临床决策支持的实际需要。基于此,本文旨在分析2019年PhysioNet/心脏病学计算挑战赛共享的ICU患者的电子病历数据,设计并开发一套基于改进的机器学习方法的自动识别患者脓毒症发作时间的风险预测模型,以期在临床发作前的6至12小时内,实现对脓毒症的早期预测;同时对该预测模型进行可解释性分析,挖掘出预测脓毒症发作的主要影响因子,继而提高模型的可解释性与可靠性。首先,本文聚焦于对数据集的探索与挖掘,分析了数据分布特点,通过预处理有效地解决了数据不平衡、缺失率高、数据质量低等问题,构建了高质量的样本集。然后,本文根据数据集特点设计了特征扩展方案,在40个原始特征基础上提取了三组新特征:对缺失数据信息的挖掘(102个)、基于滑动时间窗口的统计特征计算(30个),以及基于临床评估量表的经验特征的提取(8个),从而提高了数据的可用性与多样性,后续实验证明了数据预处理与该特征工程在提高预测准确率等多种评估指标方面的有效性。接着,本文针对脓毒症早期预测任务,分别开发了基于随机森林、XGBoost与集成学习的三组预测算法,并对三种预测模型进行训练、优化、验证和评估,最终得到的最佳模型(基于异质集成)的效用分数可达0.4601,AUROC为0.8615;最佳XGB oost全模型的效用分数为0.4588,AUROC为0.8608;最佳随机森林全模型的效用分数为0.4274,AUROC为0.8465。本文所提出的模型的性能可媲美或略优于基于相同数据集的其它研究。同时,本文使用经特征筛选得到的特征子集,重新训练了相应的简化模型(Compact model),该简化模型被进一步应用于后续分析中。最后,本文采用了两种可解释性分析方法,对所开发的最佳简化模型,分别从特征重要性和各特征对模型输出的影响模式两方面进行了解析。首先,本文创新性地将Morris敏感性分析方法应用于机器学习模型的分析中,通过对各个变量值添加扰动,计算各个变量值对模型输出的影响程度,从而检测出最重要的变量;同时应用了另一种基于博弈论中边际贡献的可解释性分析模型SHAP,作为Morris方法的对比和补充。可解释性分析的结果表示,Temp(体温)、ICULOS(ICU入院时长)、HR系列(心率相关)、FiO2系列(吸入氧气分数相关)、Resp(呼吸频率相关)以及MAP系列(平均动脉压相关)等特征是脓毒症早期预测的主要风险指标,且当Temp与ICULOS数值越大或HospAdmTime特征越小时,模型做出脓毒症诊断的可能性也随之增加。分析结果与现有临床经验相一致,这为模型的可解释性和可信度提供了有力支持,同时为临床提供了一定启发。综上,本文建立了完整的脓毒症早期预测与分析的数据处理链路,训练并优化了机器学习预测模型,并对模型的可解释性分析开展了一系列的深入研究,最终以较高性能完成了预测任务;同时,通过应用可解释性分析,实现了对模型输出的定性与定量解释,从而提高了模型的透明度与可信度,为该系列模型在临床中的实际应用提供了理论保障。
其他文献
柿蒂为柿树科植物柿Diospyros kaki Thunb.的干燥宿萼,具有降气、反胃,呕吐、止呃逆的功效。柿蒂资源极其丰富,作为一种常用中药,其质量因采摘季节、生长环境的不同有所差异,进而导致药效不同,给临床用药带来不便。目前,2015版《中国药典》中柿蒂项下没有含量测定项,无法保证柿蒂药材的内在质量,本文旨在提高柿蒂药材的质量标准,对柿蒂药材质量进行评价。本文收集了12批不同产地的柿蒂药材,参
近些年来,随着工农业的发展,导致了水体的富营养化,促使了水华的发生。水华造成了水生生态系统严重受损和藻毒素污染等水质污染问题,严重危及着人畜及水生生物的健康。由于藻类自身的特性加大了处理这种含藻水的难度,这成为水污染领域的研究者们亟待解决的问题。吸附絮凝除藻作为一种应急除藻方法,由于其简单,高效,无二次污染,易于应用的优点,受到日益广泛的关注。磁性纳米微球作为一种新型环保节能的除藻材料应运而生。本
水下生产系统长时间在海底运行会出现落物抛锚、海洋腐蚀等现象,导致系统发生失效。由于水下生产系统一般固定在海床上,多数情况下只能使用遥控水下机器人进行定期巡检,所以急需开展对深海视频监控系统研究,取代遥控水下机器人定期巡检,对水下生产系统的运行状态进行实时监测。本文针对深海视频监控系统的工作环境进行分析,结合技术指标对深海视频监控系统进行方案研究;通过ANSYS软件仿真和多项式拟合曲线方程对BK7材
乙基香兰素由于其强烈的独特香子兰气味,作为香味添加剂被广泛应用于食品药品、化妆用品等领域。乙基香兰素的香味是香兰素的好几倍,无毒无害,是香兰素的替代品,有着广阔的前景,但是其在水中溶解性不好(微溶),非常不稳定,在长时间光照或者暴露在空气中会被氧化,香气香味易挥发。本文利用共晶原理制备香料共晶潜香物质和香料微胶囊化,一方面提高乙基香兰素的贮藏稳定性,保护香气物质;另一方面提高乙基香兰素的热稳定性,
目的 了解口腔医学专业实习生的实习满意度与职业认同感,分析其实习现状和职业认同的认识差异,了解实习中存在的问题,探讨影响实习满意度的因素及实习满意度与职业认同感之间的关系。为进步改善实习环境、提升实习教学质量,提高职业认同感提出参考建议,促进口腔人才培养。方法 选取2020年9月至2021年6月的来自浙江中医药大学口腔医学专业的112名在杭实习生作为研究对象,通过网络发放问卷的形式调查实习满意度和
研究目的:神经炎症与多种认知损伤性疾病相关,被认为是认知损害的主要原因之一。然而神经炎症通过何种机制导致认知损伤机制不清。神经元周围网络(Perineuronal nets,PNN)是一种特殊类型的细胞外基质结构,其主要围绕在微清蛋白阳性神经元(PV中间神经元)的胞体和近端树突周围,在控制中枢神经系统可塑性方面发挥重要作用。但在神经炎症中,尚不清楚PNN和PV的变化及其作用。因此,本课题以脂多糖(
混合增材制造技术是增材制造(3D打印)领域的发展前沿,该技术将增材制造工艺与其他先进制造工艺相结合,实现全功能产品的一体化直接制造,改变了传统增材制造工艺仅能实现复杂三维零部件加工的局限。本课题组提出了一种基于熔融沉积成型(FDM)3D打印工艺的混合增材制造技术,该技术将双材料FDM 3D打印工艺与选择性化学镀工艺相结合,制造聚合物-金属复合材料结构,实现三维电子电路产品。在推动该技术实际应用过程
氮化碳(CN)材料凭借着优异的光学、电子特性以及制备简单、成本低廉等优势,被广泛地应用于光催化、光电化学和生物传感等领域。CN结构中含有丰富的不饱和N,能够为金属的配位提供丰富的孤对电子。基于这一结构特性,金属掺杂的CN材料(M-CN)得到了广泛研究。金属以离子、单原子等形式引入CN后,极大地修饰了CN的电子结构,不仅改善了CN高载流子复合率的短板,提高了光催化性能,还赋予了其新催化活性,相关应用
学位
水泥基材料是目前应用最广泛的建筑材料,其耐久性是业内关注的焦点,特别是干缩及其导致的开裂问题。虽然文献上对水泥基材料的干缩进行了大量系统的研究,然而多数研究还侧重于干缩的现象及规律,而研究方法通常是通过在提前制定的湿度条件下平衡并测量得到整体干缩应变。这不仅忽略了不同干燥条件之间的湿度区间,更重要的是,对整个样品的平均干缩变形没有考虑到内外干燥不同的影响。另外,在干缩机理方面一直存在争议,特别是几