基于机器学习的急性缺血性卒中3个月预后预测研究

来源 :北京大学医学部 | 被引量 : 0次 | 上传用户:zhhs555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】在入院和出院时间点两类应用场景下,使用logistic回归探究急性缺血性卒中(Acute ischemic stroke,AIS)3个月预后的影响因素并建立预测模型,并以该模型为基准,使用随机森林、极端梯度提升(e Xtreme Gradient Boosting,XGBoost)两种机器学习方法建立预测模型,评价模型的预测效果,为两个应用场景分别寻找合适的预测模型,为有效改善AIS患者的预后提供参考。【方法】本文1选取中国国家卒中登记第二期(CNSR-2)数据库中15087例AIS患者作为入院时间点场景的研究对象,由于107例患者院内死亡,选取14980例AIS患者作为出院时间点场景的研究对象。以患者3个月的改良Rankin量表(Modified Rankin Scale,m RS)评分是否大于2作为因变量,在入院时间点场景下,预测变量由患者一般人口学特征、个人史/既往史/用药史、入院检查指标和入院一般情况4个维度共计35个变量构成,在此基础上,出院时间点场景进一步考虑到患者院内的治疗及检查措施、并发症、急性期恢复、出院情况和出院二级预防策略5个维度的20个变量,共计55个变量。按照7:3的比例将数据分成训练集和测试集,训练集用来训练模型,对于机器学习模型,使用等渗回归(Isotonic regression,IR)方法对模型的预测概率进行概率校准。在测试集上使用受试者工作特征曲线下面积(Area Under Curve,AUC)来评价模型的区分度,使用Hosmer-Lemeshow(H-L)检验、校准图以及Brier Score来评价模型的校准度,使用AUC、净重新分类改善指数(Net Reclassification Imporvement,NRI)、综合判别改善指数(Integrated Discrimination Imporvement,IDI)来比较不同模型的预测效果。【结果】入院时间点场景下,logistic回归的AUC为0.8028(95%CI:0.7854~0.8202),H-L检验通过(P>0.05),Brier score为0.110,校准图呈45度角分布。未经过概率校准的随机森林的AUC为0.8017(95%CI:0.7840~0.8194),H-L检验不通过(P<0.001),Brier score为0.118,校准图偏离45度角,经过概率校准后的随机森林AUC为0.8027(95%CI:0.7851~0.8204),H-L检验通过(P>0.05),Brier score为0.109,校准图呈45度角分布。概率校准前后,XGBoost的AUC均为0.8105(95%CI:0.7934~0.8276),H-L检验均通过(P>0.05),Brier score均为0.107,校准图呈45度角分布。模型间对比上,随机森林与logistic回归的AUC无差异(P=0.984)、NRI=0(P=0.458)、IDI=0(P=0.585),XGBoost的AUC优于logistic回归(P=0.015)、NRI>0(P<0.001)、IDI>0(P<0.001)。出院时间点场景下,logistic回归的AUC为0.8599(95%CI:0.8499~0.8749),H-L检验通过(P>0.05),Brier score为0.092,校准度呈45度角分布。未经过概率校准的随机森林AUC为0.8634(95%CI:0.8485~0.8782),H-L检验不通过(P<0.001),Brier score为0.100,校准图偏离45度角,经过概率校准后的随机森林AUC为0.8630(95%CI:0.8482~0.8778),H-L检验通过(P>0.05),Brier score为0.091,校准图呈45度角分布。概率校准前后,XGBoost的AUC均为0.8668(95%CI:0.8522~0.8815),H-L检验均通过(P>0.05),Brier score均为0.089,校准图呈45度角分布。模型间对比上,随机森林与logistic回归的AUC无差异(P=0.437)、NRI=0(P=0.366)、IDI=0(P=0.512),XGBoost的AUC优于logistic回归(P=0.026)、NRI>0(P<0.001)、IDI>0(P<0.001)。【结论】(1)不论入院还是出院时间点场景,在使用随机森林模型对AIS患者的预后进行预测时,均需要使用IR方法进行概率校准,模型才会具有较好的校准度。XGBoost模型则不需要IR方法进行概率校准,也具有好的校准度。(2)不论入院还是出院时间点场景,logistic回归、经过校准的随机森林模型、XGBoost模型的区分度和校准度均较好,均可用于对AIS患者的预后预测。(3)不论入院还是出院时间点场景,XGBoost模型的预测效果均优于logistic回归,随机森林模型的预测效果与logistic回归差异均无统计学意义。(4)在入院时间点场景,对AIS患者预后进行预测时,推荐使用简单的logistic回归模型,在出院时间点场景,推荐使用XGBoost和经过校准的随机森林模型。
其他文献
【目的】1.分析人群HPV感染和细胞学病变流行特征及不同筛查结果的检出情况,探讨联合筛查策略在大规模人群筛查中检出子宫颈癌前病变及浸润癌的准确性。2.比较联合筛查策略与细胞学筛查策略在人群筛查中对子宫颈癌前病变及浸润癌的检出效果及保护效力的差异。【方法】1.准确性研究:基于2015-2019年北京市通州区子宫颈癌人群筛查项目开展横断面研究,共纳入50933名妇女进行分析。比较1种细胞学筛查策略(细
学位
【研究目的】1.研究孕早期未治疗的亚临床甲状腺功能减退(SCH)、单纯低甲状腺素血症(IMH)、单纯甲状腺过氧化物酶抗体(TPOAb)阳性与胎儿生长和妊娠结局的关联,以及分析不同的促甲状腺激素(TSH)参考范围上限对SCH与胎儿生长和妊娠结局关联的影响;2.研究孕早期SCH妇女进行左旋甲状腺素(LT4)治疗对胎儿生长和妊娠结局的作用,以及分析不同的TSH参考范围上限的影响。【对象和方法】1.孕早期
学位
背景:丙型肝炎起病隐匿、慢性化率高,易发展为肝硬化和肝癌等终末期肝病,我国实现世卫组织“2030年消除病毒性肝炎”的目标仍面临较大挑战。丙型肝炎以抗病毒治疗为主,尚无疫苗进行预防。直接抗病毒药物(Direct acting antivirals,DAAs)转变了传统干扰素的治疗模式,但DAAs价格昂贵、种类繁多,患者的治疗决策和医保报销决策更为复杂。目的:对我国丙型肝炎主要基因型(1b型、2型、3
学位
【目的】1.评估妊娠早期血浆中多环芳烃(Polycyclic aromatic hydrocarbons,PAHs)、有机氯农药(Organochlorine pesticides,OCPs)、多氯联苯(Polychlorinated biphenyls,PCBs)和多溴联苯醚(Polybrominated diphenyl ethers,PBDEs)的暴露水平。2.分析妊娠早期有机污染物(PAH
学位
【目的】评估一项儿童肥胖综合干预的保真度和依从性,并分析其与肥胖相关指标变化的关联,探讨影响干预依从性的因素。【方法】本研究基于一项儿童肥胖综合干预项目[The Diet,Exer CIse and Car Diovascular h Ealth(DECIDE)-Children study],共纳入北京、山西长治、新疆乌鲁木齐三个地区12所学校20个班级的686名干预组(接受肥胖综合干预)儿童。
学位
智能化是钢铁工业发展的重要方向之一,随着我国铸造业的迅猛发展以及信息技术实力的日益增强,作为铸造工艺的核心优化目标之一的智能化炉前加料越来越受到广大铸造企业的重视。然而,当前大部分铸造企业熔炼车间的炉前加料工艺中,记录车间生产数据以及计算炉料添加仍然主要为人工记录和手工经验计算,这种方式实时性差、整个加料周期长、炉料计算精度无法得到保障以及生产历史数据难以追溯。当前国内外大部分炉前加料的研究主要集
学位
铂是地壳中最稀有的元素之一,我国铂储量较少,供需矛盾日益突出。与原生铂族金属矿的开采和冶炼相比,回收失效铂催化剂具有更大的经济效益和环境效益,因此,研究铂族金属资源的综合高效回收利用迫在眉睫。失效铂催化剂的回收工艺主要有载体溶解法、贵金属溶解法和全溶解法。其中,全溶解法消耗大量试剂,污染环境,且在催化剂使用过程中,由于载体和有机物的包封,使得贵金属溶解法难以实现。载体溶解法可分为酸溶法和碱溶法,其
学位
近些年,随着社会信息化的发展,互联网应用服务已经深入到人们生活的方方面面。互联网服务提供商们面临用户对互联网应用服务的体验要求越来越高的挑战。在互联网服务提供过程中,各项服务业务随时可能会遇到各种各样的问题,这些问题的出现会影响用户的使用体验,对用户的使用造成困扰。这就要求企业收集相应的服务日志,从中发现问题所在并及时进行修复,但大型服务的日志通常具有海量规模,因此如何有效的收集和分析日志并及时反
学位
作为目前工程应用中最轻的金属结构材料,镁合金拥有广泛的应用前景。通过热挤压工艺成形变形镁合金,可以细化显微组织,消除铸造缺陷,提升产品的综合性能。但传统的热挤压坯料采用半连续铸造工艺生产,晶粒尺寸粗大,缺陷较多,往往需要通过均匀化退火、去皮、预热等中间辅助工序才可进行热挤压。同时,受铸坯原始组织与变形方式的限制,常规挤压对晶粒尺寸的细化效果往往不尽如人意,且存在明显的变形织构,导致室温塑性较差,各
学位
近几十年,中国社会发展迅速,人民生活水平不断提高。但与此同时,环境问题日益突出,大量工业与生活废水未经处理便被直接排放到环境中,造成很多水体污染事故。臭氧因其强氧化性,自上世纪以来便一直被应用于污水处理领域。臭氧发生器的电源从工频高压电源发展到高频高压电源,发热与效率有所改善,但在实际应用中仍然存在发热量大和臭氧制备效率低的问题。脉冲电源可以产生很陡的上升沿,尽可能地只加速电子而不加速离子,提高非
学位