论文部分内容阅读
目的:Adaboost (Adaptive Boosting)算法是经过改进的Boosting算法,具有能够显著改善子分类器、不需先验知识等优点.而临床数据往往具有样本量较小、不对称性、冗乱、不完整性等特点,因此使用传统统计学方法得出的预后预测指标常常在不同的研究中不一致.在本研究中,我们把Adaboost算法应用于寻找肿瘤患者有意义的临床及分子学预后指标,并构建可切除Ⅱ/Ⅲ期胃癌患者的预后分类模型.方法:选取1996年1月至2009年12月期间在中山大学附属肿瘤医院确诊胃癌并接受D2根治术的患者,术后根据第7版UICC的TNM分期为Ⅱ/Ⅲ期,且有完整的随访资料.记录患者的临床资料及肿瘤的生物学特性,收集患者的术后石蜡标本并制作成组织芯片.通过免疫组化染色检测33个与肿瘤生长、浸润、转移相关的分子生物学指标在肿瘤组织中的表达.将461例患者的临床特征及分子指标数据作为样本集,对患者的生存情况进行二值化处理后,再对样本集预处理后执行Adaboost算法,得出最终的预后分类模型.计算预后分类模型的预测准确度,并分析经模型分类为两组的患者的生存情况.结果:初步建立了基于Adaboost算法的Ⅱ/Ⅲ期胃癌预后分类模型,预后模型将患者分为高风险组209人和低风险组230人,模型的敏感度为69.9%,特异度为74.5%,正确率为72.2%,同时筛选出6个预后因素:N分期,脉管浸润,辅助化疗,肿瘤组织中CD44v6,MUC2,TIMP-1的表达情况.预测为高风险组患者和低风险组患者的Kaplan-Meier生存曲线明显分离(P<0.0001).结论:基于Adaboost算法的Ⅱ/Ⅲ期胃癌预后分类模型可以对胃癌根治术后的患者进行危险分类,较准确的预测Ⅱ/Ⅲ期胃癌患者根治术后生存情况,同时筛选出预后因素.