可解释机器学习模型预测心脏骤停患者院内死亡风险:基于MIMIC-Ⅳ2.0数据库

来源 :协和医学杂志 | 被引量 : 0次 | 上传用户:xiaoniaohk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的 构建可预测心脏骤停患者住院期间死亡风险的机器学习模型,并对其进行解释。方法 提取美国重症监护医学信息数据库Ⅳ(Medical Information Mart for Intensive Care databaseⅣ,MIMIC-Ⅳ)2.0中心脏骤停患者转入ICU 24 h内首次临床资料及住院期间转归,基于机器学习算法构建6种可预测心脏骤停患者院内死亡风险的模型,包括XGBoost模型、轻量级梯度提升机(light gradient boosting machine, LGBM)模型、决策树(decision tree, DT)模型、K近邻(K-nearest neighbor, KNN)模型、Logistic回归模型、随机森林(random forest, RF)模型。采用受试者操作特征(receiver operator characteristic, ROC)曲线、临床决策曲线及校准曲线对模型进行评价,并采用Shapley加性解释(Shapley additive explanation, SHAP)算法评估不同临床特征对最优模型的影响,以增加模型的可解释性。结果 共1465例符合纳入与排除标准的心脏骤停患者入选本研究。其中住院期间存活773例、死亡692例。经筛选,共纳入82个临床特征用于机器学习模型构建。模型评价结果显示,相较于其余5种模型,LGBM模型预测心脏骤停患者院内死亡的曲线下面积(area under the curve, AUC)更高[0.834(95%CI:0.688~0.894)],且相对于Logistic回归模型、XGBoost模型,其对死亡风险的预测准确性更高(校准度:0.166),临床决策性能更优,整体性能最佳。SHAP算法分析显示,对LGBM模型输出结果影响最大的3个临床特征分别为格拉斯哥睁眼反应评分、碳酸氢盐水平、白细胞计数。结论 基于大型公共医疗卫生数据库建立的可预测心脏骤停患者住院期间死亡风险的机器学习模型中,LGBM模型性能最优,其可辅助临床进行更高效的疾病管理和更精准的医疗干预。
其他文献
投资是企业的一项核心活动,决定企业盈利水平和长期发展,也是扩大内需、经济持续增长的重要动力。然而,现实中企业整体投资效率并不乐观,以往粗放型投资模式显然不适合我国经济高质量发展要求,如何改善企业的非效率投资现状成为亟需解决的问题。税收征管作为一种外部监督机制,影响企业投资决策,2013-2016年在我国陆续试点实施的“金税三期”工程,通过大数据、人工智能、区块链等新技术,使传统经验管理向现代数据管
学位
目前,推动区块链在工业物联网中的应用已经成为重要的产业发展方向。区块链能够为各工业部门提供更加安全可信的数据共享及计算环境,并降低基础设施构建所需的成本。然而,区块链智能合约的封闭性限制了它主动与外部系统进行交互的能力,难以处理涉及实时数据的计算任务。同时,链上大量的工业数据带来了巨大存储压力,使存储资源受限的工业物联网节点难以参与到区块链服务中。分布式预言机为区块链系统提供了一种相对可信的数据获
学位
持续的经济高速增长,使中国的保险业在扩大开放、深化改革的进程中得到不断的发展,呈现出日渐市场化、专业化、国际化、规范化的新特点。同时随着人口规模的增大、教育水平的提升,城市化进程加快,特别是金融市场迅速发展而导致的民众投资需求加大以及人口老龄化、社会福利制度的改革,在这些社会变迁因素的推动下,人们的保险意识和保险需求也不断升级,中国保险业将继续快速增长。自中国保险业于1979年开始恢复业务,至今四
学位
在数字经济和全球大数据飞速发展的背景下,随着网络速度和储存技术的突飞猛进,数据的产生速度、总体规模、应用频率都在不断增长,在各个方面深刻影响着企业的生产和人们的生活。世界各国都对大数据技术表现得非常重视,并将数据定义为一项战略资产,高度重视数据资产的开发与利用。近年来我国也大力发展数字经济,党的二十大报告提出:“加快发展数字经济,促进数字经济和实体经济深度融合”,而数据要素是数字经济发展的基础性、
学位
查询是获取信息的重要手段,大数据给经典的数据查询理论和方法带来了新的挑战,这些挑战制约着大数据的应用及发展。大数据查询的核心问题是查询解答问题,规模庞大是大数据最突出的一个特征,围绕该特征的查询解答问题是目前的研究热点。首先,本文给出了大数据的形式化定义,根据大数据具有的特征描述出了数据库向大数据的演变过程,并归纳出八类大数据。基于数据规模庞大这一特征,以关系型数据为对象,对大数据查询解答问题进行
学位
在百年未有大变革的背景下,我国推动创新的决心一直坚定不移。伴随着移动互联网、物联网、大数据等数字技术的发展与普及,数字化的重要性也越来越得到彰显。本文关注如何科学准确地衡量我国数字化水平以及区域创新能力,并就数字化水平及其各个维度对区域创新能力的影响以及区位的异质性进行了研究。通过文献回顾,本文从数字基础设施、数字个人生活、数字企业发展以及数字政府治理4个维度构建数字化水平指标体系,并从创新投入、
学位
我国作物种子市场规模不断发展壮大,种子生产加工以及跨区域销售的数量日益增加。实现对种子仓库储藏环境的实时性监测与调控,提升检测调控自动化水平,使其向智能化方向发展,已经成为未来种子储藏行业的发展趋势。针对人工巡检通风效率低、劳动强度大以及通风调控时效性差的问题,提出调控系统与物联网结合应用的方法,设计种子仓库安装温湿度自动调控系统,用户使用电脑或手机软件实现对仓库内部环境的远程监控与调节。系统主要
学位
当前,由于经济社会的发展,迫切要求政府审计工作发挥其高效、精准的监督职能,更好地服务于国家治理。在大数据背景下,传统审计模式的弊端愈发明显。因此,如何把大数据分析技术全面运用到审计工作中,打破传统审计模式的弊病,完成向大数据审计模式的完美转变,是当前至关重要的任务。本文拟在大数据背景下,基于所在的工作部门,研究我国政府审计模式向大数据审计方向转型的历程与现状,针对当前我国政府审计模式转型中存在的问
学位
目的 构建心脏骤停患者院内死亡的预测模型。方法 本研究为回顾性分析,纳入美国重症监护医学信息数据库Ⅳ(medical information mart for intensive care-Ⅳ,MIMIC-Ⅳ)2.0中出院诊断包含心脏骤停且具有ICU入住经历的18岁以上成年患者。研究采用逐步回归筛选变量,选取逐步回归分析结果中P<0.05的变量并纳入多因素Logistic回归,以构建心脏骤停患者院
期刊
以大数据、区块链、云计算、人工智能为主的新一代数字技术的兴起标志着数字经济时代的到来,新时代背景下,不仅带来了产业的创新发展,还为国有企业转型提供了有力手段,通过借助大数据的分析能力强化了平台公司的投资风险管控水平;借助现代化资产管理手段盘活了企业资产,带来了资产经营性收益。数字化转型已经成为新经济形势下企业发展的必然趋势,更成为提升公司经营能力、产品服务水平的一个重要的竞争性手段。本文以NC城投
学位