随机生存森林在不同维度肺癌患者预后预测中的应用

来源 :山西医科大学 | 被引量 : 0次 | 上传用户:gululukuaican
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:传统的常用的生存预测模型是Cox回归,但其受到比例风险假定的限定,不适用于分析如今的变量数远大于病例数的高维数据。本文针对公共数据库中的肺癌患者的生存数据对患者的预后构建风险预测模型,将探讨基于RSF变量选择偏倚进行改进的最大选择秩统计分裂规则与常用RSF分裂规则的四种RSF模型在低维的临床数据和高维的临床及基因表达数据中预测的优劣,丰富临床生存资料的预测模型,为临床不同患者得到更精确的预后预测及个性化预后治疗提供统计学支撑。方法:介绍RSF在不同的分裂规则下的模型构建的基本原理,针对不同维度的数据来进行研究,低维数据来源于山西省某三甲医院呼吸科,随访队列人群为首次确诊并住院治疗的肺癌患者共342名患者,12个预测变量以及生存时间和生存结局。高维数据为通过公共数据库TCGA下载肺癌患者的生存数据共422例,包含临床资料10个变量,基因表达量330个,以及生存时间和生存结局;分别对低维和高维数据,以患者的生存结局和生存时间作为响应变量,构建肺癌患者预后预测模型Cox(或LassoCox)、RSF,以及最大选择秩统计的RSF,探讨不同模型筛选出的重要影响因素,对比不同模型的预测效果。结果:不同模型在低维生存数据上结果显示:RSF各类分裂规则均筛出5个预测变量,分别是treat,stage,size,degree,lni5个变量,但变量的重要性排序略有差异。不同模型预测能力比较:训练集上,Cox模型的i AUC为0.742,与RSF各类分裂规则的模型相比为最低。RSF各类分裂规则的模型中,log-rank分裂规则与MSR-RF的i AUC最高为0.997;C指数上log-rank分裂规则最高为0.711;MSR-RF的IBS得分最低为0.116(p<0.001)。测试集上,MSR-RF的i AUC仅次于log-rank分裂规则排名第二,其IBS最低为0.141(p<0.001)。在高维生存数据上的结果:Lasso-Cox模型最终筛出的变量为19个,四类RSF模型筛出的变量均大于30个。模型预测能力比较:与四类RSF模型相比,Lasso-Cox模型性能在训练集与测试集差异大。RSF的四类模型中,表现最好的是log-rank分裂规则,其i AUC与IBS表现均优于其他三类模型,最差的是log-rank score,其IBS最高为0.375(p<0.05)。本研究介绍的基于RSF模型改善的MSR-RF模型的预测表现无明显优势。结论:本研究通过比较不同预后预测模型在低维数据和高维数据中模型的预测效果,介绍了基于RSF改进的MSR-RF模型来建立肺癌患者预后的预测模型,在不同维度下,将Cox模型(或Lasso-Cox)与RSF内置的3类模型以及MSR-RF,共6类模型进行比较后得出,RSF可识别变量间复杂的交互作用,模型的预测区分度与预测准确性均较好。MSR-RF在低维数据中表现较好,但在高维数据中其优势并未体现出来。研究将MSR-RF运用在肺癌患者的生存预测中,在较低维度的临床数据中能够较为准确的进行结局预测与影响因素的鉴别,但当数据维度较高时,RSF的log-rank分裂规则预测性能与其他模型相比性能较优。
其他文献
目的:探究LATS1基因在骨肉瘤中发挥的作用,利用去甲基化药物使LATS1基因的表达增高,从而研究其对人骨肉瘤细胞功能的影响。方法:(1)免疫组织化学染色检测人骨肉瘤组织和正常骨组织中的大肿瘤抑制基因-1(Large Tumor Suppressor gene 1,LATS1)基因的表达差异情况。采用q RT-PCR检测人骨肉瘤组织、正常骨组织和成骨细胞(Hfob1.19)、人骨肉瘤细胞系(Sao
目的:本研究旨在分析同一手术团队单孔胸腔镜下解剖性肺段切除术治疗非小细胞肺癌的学习曲线,为临床技术熟练所需病例数提供参考价值方法:回顾性分析2018年1月~2021年1月由同一手术团队连续完成的单孔胸腔镜下行解剖性肺段切除术治疗非小细胞肺癌76例资料,使用累计和(cumulative sum,CUSUM)方法分析其学习曲线,并对学习曲线不同阶叶的手术评估指标(手术时长、手术出血量以及淋巴结清除数量
目的:通过调阅2014年7月至2018年7月初诊于山西医科大学第二临床医院的宫颈癌病人电子病历信息包括一些基本信息和病理信息,应用2018年FIGO宫颈癌新分期修正以上宫颈癌病人的分期,随访调研宫颈癌病人的生存情况,旨在验证新分期的合理性并探讨新分期下宫颈癌患者的临床特征及影响预后的因素。方法:1、收集2014年7月至2018年7月在山西医科大学第二临床医院收治的宫颈癌患者277例,记录患者信息,
目的:比较中低位直肠癌新辅助放化疗后行腹腔镜与开腹手术的临床疗效及安全性。方法:检索中英文数据库中有关本项研究的中英文文献,纳入时间为2010年1月至2020年10月,筛选文献及质量评价后,用Rev Man5.4软件进行meta分析。结果:8篇文献被纳入研究,共1017例患者,腹腔镜组496例,开腹组521例。Meta分析结果提示:相较于开腹组,腹腔镜组的术中出血量(WMD=-74.78,95%C
目的:探究二次肿瘤细胞减灭术(Secondary Cytoreductive Surgery,SCS)+化疗与单纯化疗对首次复发的初始手术不满意减瘤的铂敏感复发性卵巢癌患者治疗后无进展生存期(Progression-free Survival,PFS)和总生存期(Overall Survival,OS)的影响。方法:收集山西省肿瘤医院2005年1月至2018年12月收治的共计116例首次复发的铂敏
目的:探讨静脉化疗联合腹腔化疗在上皮性卵巢癌患者中的应用价值,并比较顺铂腹腔化疗与卡铂腹腔化疗治疗效果。方法:收集自2010年1月至2015年12月,就诊于山西省肿瘤医院的卵巢浆液性乳头状腺癌患者资料,共计101例,根据他们是否接受过腹腔内化疗,分为静脉化疗联合腹腔化疗的研究组和单纯静脉化疗的对照组,其中61人在研究组和对照组40例。其次,根据腹腔内化疗药物的不同将研究组分为顺铂腹腔化疗组和卡铂腹
目的:探讨乳腺癌患者术后焦虑、抑郁、生命质量及其影响因素,探讨社会支持对生命质量的影响,为进一步改善患者预后及评价生命质量提供依据。方法:采用一般情况调查表、焦虑自评量表(SAS)、抑郁自评量表(SDS)、领悟社会支持量表(PSSS)、乳腺癌患者生命质量测定量表(FACT-B),对2018-2020年中国科学院肿瘤医院(浙江省肿瘤医院)423例乳腺癌术后患者进行横断面调查。调查内容包括:社会人口学
目的:探讨经皮穴位电刺激(TEAS)对腹腔镜结直肠癌根治术患者麻醉及术后康复的影响。方法:选择山西省人民医院2019年1月至2020年5月期间,择期腹腔镜结直肠癌根治术患者80例。随机数字法分为两组,T组(TEAS组)和C组(对照组),每组40例。T组于麻醉诱导前30分钟经皮电刺激足三里、内关、合谷穴,频率2Hz,刺激强度为患者能耐受的最适强度,刺激时间为麻醉诱导前30分钟起,到手术结束止。C组只
目的:研究不同剂量利多卡因对腹腔镜子宫肌瘤切除术患者麻醉诱导期间QT间期(QTc)的影响。方法:将拟行腹腔镜子宫肌瘤切除术的80例女性患者,采用随机数字表法分配到A(空白剂量组)、B(低剂量组)、C(中剂量组)及D(高剂量组)四组,每组20例。B组、C组和D组分别在麻醉诱导后静脉注射配制的等容积利多卡因0.5mg/kg、1mg/kg和1.5mg/kg,同时A组静脉注射等容积的生理盐水。记录麻醉诱导
目的:评价改良法胸神经阻滞对乳腺癌改良根治术患者早期恢复质量及外周血Treg细胞的影响。方法:选择择期、初次行乳腺癌改良根治术女性患者60例,随机将患者平均分为三组:改良法阻滞组(STG组)、传统前锯肌平面阻滞(serratusanteriorplaneblock,SAPB)复合全麻组(SG组)和全麻+术后自控静脉镇痛组(GP组)。检测患者术前、术毕即刻和术后24小时CD3+、CD4+、CD8+T