基于机器学习的重症监护病患死亡率预测

来源 :电子科技大学 | 被引量 : 7次 | 上传用户:chen_2006tt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前针对肝脏系统功能障碍相关病患的死亡率预测主要使用的方式是通过Apache评分系统进行死亡率预测,相关样本集的提取也以该评分系统的评分表为标准,该方法适用病患群体广、需要的样本数量也低,广泛应用于国内外的重症监护室。本文不同于围绕Apache评分系统进行样本集构建的研究,直接提取MIMICIII与飞利浦eICU协作数据库中的病患数据,通过样本特征筛选、缺失值处理、数据标准化等过程,使得得到的数据维度更高、缺失值更少,针对肝脏系统功能障碍相关病患的死亡预测率也更高。由于数据样本特征的复杂性,结合人工选取与方差对比的方式对样本特征进行了初步筛选。针对样本集中的缺失值部分,我们通过样本特征基尼重要性的分析,选择在MIMIC-III样本集上使用中值填补缺失值,而在eICU样本集上使用众数填补缺失值。在对数据进行标准化后,使用主成分分析(PCA)对样本集样本特征进行了降维处理,并对比了降维前后的样本集训练出的预测模型效果,结果证明未经降维的样本集更具优势。接下来我们使用随机森林、支持向量分类、多层感知器神经网络等机器学习方法,分别在MIMIC-III样本集与e ICU样本集上实现了样本的肝脏系统功能预测、死亡率预测以及肝脏系统功能障碍样本的死亡率预测。同时,为了确认预测模型的稳定性与泛化能力,引入了召回率、f1分数等模型评价指标,对不同样本集下的多种算法模型逐一分析。这里为了验证本文研究方法的有效性,我们对比了使用Apache-IV评分系统进行死亡率预测的效果,发现本文所使用的机器学习算法预测正确率更高。在对预测模型分析的过程中,通过样本特征的基尼重要性对比,我们发现部分样本特征在病患死亡率预测中表现出较高的重要性。同时,对比原始样本集,肝脏系统功能障碍样本集进行死亡率预测时,负离子间隙(Anion gap)表现出更高的基尼重要性,而在去除负离子间隙这项特征后,肝脏系统功能障碍样本集的死亡预测正确率出现了下滑,这表明负离子间隙与肝脏系统功能障碍间存在潜在的联系。
其他文献
目的 了解北京市中老年人群对老年痴呆相关知识的知晓情况及对该病预防知识的宣教需求。方法 采用随机抽样的方法对北京市230名中老年人进行问卷调查。结果 老年痴呆危险因素
摘 要:随着经济全球化,区域化的不断发展,国家之间的人员往来愈加便捷。我国经济进入新常态,随之服务贸易在促进经济发展中的重要性更加凸显。旅游服务贸易是我国服务贸易中所占比重最大,而浙江又是全国经济强省,其旅游资源丰富,历史文化深厚,如何在新常态下走出新的发展之路是必须考虑的问题。基于此,分析浙江旅游服务贸易的现状、问题,最后提出促进新常态下浙江国际旅游服务贸易发展的对策。  关键词:新常态;浙江;
新中国成立70年来的历史是人类发展中的一部传奇史,中国农业农村科技的进步和创新是其中最为瑰丽的篇章之一。回顾70年的峥嵘历程,“六化”成为中国农业农村科技越来越清晰的
结合现场采购管理工作,从采购管理现场服务的准备工作,采购现场的文件管理,采购现场的常见问题处理,对采购管理中的现场服务工作进行了详细探讨,对EPC总承包工程的采购管理的现场
摘要:在搜集整理大量国内外企业风险承担文献的基础上,分析了国内外关于企业风险承担影响因素的研究综述。根据现有文献分别从企业自身因素和外部宏观因素的角度研究了其对企业风险承担的影响。同时从这两个角度进行文献评述,为风险企业风险承担影响因素的研究提供参考。  关键词:企业风险承担;企业风险承担影响因素  中图分类号:F74文献标识码:A文章编号:16723198(2015)26006303  近年来,
随着市场经济改革力度不断扩大,国有企业党建与企业文化建设管理在意识形态、组织建设、制度建设等方面存在诸多问题,界定两者的工作内容和存在的关联性,采取积极有效策略,实现国
据工信部最新统计数据显示,5月份,我国电话用户总数突破12亿,电信业务总量完成1000.6亿元,电信主营业务收入完成823.5亿元。1~5月份,全国电信业务总量累计完成4657.7亿元,同比
运用多元线性回归模型、协整分析和Granger因果性检验等方法对广西2000-2012年的商品房投资额、生产总值增长率和城镇化水平的相互关系进行分析和研究.结果显示:广西的城镇化
'越是欠发达地区越需要实施创新驱动发展战略',习近平总书记在视察宁夏时提出的这一重要论述,从战略和全局高度为欠发达地区发展把脉定位,也使欠发达地区更加清晰地