论文部分内容阅读
结肠癌是全球癌症死亡的最主要因素之一。预后的差异与很多复杂因素有关。这增加了临床实践中对预后和决策的准确评估。本文从SEER数据库获得了161694例结肠癌患者的9个临床特征,并从TCGA数据库中收集了临床特征和四种类型的分子数据集,包括m RNA、lnc RNA、mi RNA和DNA甲基化表达谱。针对结肠癌患者术后阳性淋巴结对评估患者的病情严重程度以及下一步的治疗方案选择至关重要,本文利用信息增益的方法,提供了新的阳性淋巴结比率阈值(LNR)。结果发现在患者不同的生存期时间内该阈值存在差别,一年和三年的生存时间其阳性淋巴结比率阈值为0/0.2/0.6,五年为0/0.3/0.7。单因素、多因素分析和重要性排序还发现LNR对结肠癌的预后有非常显著的影响。此外,本研究整合统计学显著的临床信息和分子层面的数据构建了一系列结肠癌的总体生存时间的分层预后预测模型。一年、三年和五年最佳预后预测模型的分类器训练集AUC分别为0.935(95%CI,0.857-0.985)、0.919(95%CI,0.87-0.962)和0.873(95%CI,0.794-0.932),Survival ROC分别是0.936、0.893和0.873。c-index分别是0.901(95%CI,0.843-0.960)、0.773(95%CI,0.728-0.819)和0.718(95%CI,0.671-0.765)。经过对模型性能的评估最终从一年、三年和五年最佳预后预测模型中分别获得8/9/4个特征组合,包括临床组合因素和一组分子特征集合。其中分子特征集是预后评估的最佳因素,一年的预后模型的分子特征集由DNA甲基化、lnc RNA和m RNA组成,三年和五年的分子特征都由DNA甲基化、lnc RNA、m RNA和mi RNA组成。T4和分化差或未分化的组合是影响一年预后的最佳临床因素,M0是影响三年和五年的预后的最佳临床因素。根据模型中的临床因素和分子特征,本研究还通过列线图提供指导原则,以预测不同随访时间的存活率。列线图的结果表明,患者一年、三年和五年的生存率大于95%,重要临床因素和分子特征的组合的累积分数分别满足小于84、82和16。本研究为临床医生从多维和复杂的患者信息中评估结肠癌患者术后生存率提供了客观标准。患者的临床特征为age>=70&T3、poorly differentiated or undifferentiated、M0&well differentiated、M0&T2、LNR high、T4&poorly differentiated or undifferentiated和分子特征组合定义为高风险组时,患者的存活时间小于1年;为M0&T2、M0&T4、LNR 0&M0、LNR median&T3、LNR high和分子特征组合定义为高风险组以及非well differentiated、M1&T3和M0时,患者的生存时间小于三年;为M1&T3、M0和分子特征组合定义为高风险组以及非N2时患者的生存时间小于五年。