论文部分内容阅读
第一部分 构建Ⅰ-ⅢA期非小细胞肺癌术后患者的条件生存概率预测模型目的:目前,对于Ⅰ-ⅢA期非小细胞肺癌(non-small cell lung cancer,NSCLC)患者的最佳术后随访策略尚无共识。本研究旨在建立基于网络的预测模型,用以预测Ⅰ-ⅢA期NSCLC术后患者癌症特异性条件生存概率(conditional probability of cancer-specific survival,CPCS),并辅助制定个体化随访计划。方法:我们从监测、流行病学和最终结果数据库(Surveillance,Epidemiology,and End Results database,SEER)中提取33241例Ⅰ-ⅢA期NSCLC术后患者的信息,并将其随机分为建模队列和内部验证队列。纳入标准包括:(ⅰ)经病理确诊为单原发性NSCLC;(ⅱ)接受肺叶切除术(含切除范围超过肺叶切除的术式如全肺切除术等)、亚肺叶切除术(肺段切除术或楔形切除术);(ⅲ)生存期>1个月。排除标准为:有其他恶性肿瘤病史;缺乏详细或完整的信息。纳入研究的变量包括种族、性别、年龄、肿瘤特征(位置、患侧、组织学类型、分化程度)、清扫淋巴结数量、手术类型、放疗记录、化疗记录、SEER病因特异性死亡结局和生存时间(月)。年龄分为<60岁、60-69岁和≥70岁3组,淋巴结清扫数量分为<16个和≥16个。在建模队列中,我们通过单因素Cox回归分析分别筛选影响Ⅰ期和Ⅱ-ⅢA期NSCLC患者预后的变量,将对预后有显著影响的变量分别纳入Ⅰ期和Ⅱ-ⅢA期的基于网络的CPCS预测模型,然后通过内部验证队列和中国医科大学第一附属医院的347例完全切除的非小细胞肺癌患者构成的CMU队列分别对预测模型的效能进行验证。我们采用Harrell一致性指数(concordance index,C-index)来衡量预测模型的区分度,采用校正曲线对预测模型的校准度进行评估,采用决策曲线分析(decision curve analysis.DCA)评价预测模型的临床应用价值和实用性。进一步地,我们还纳入了在中国医学科学院肿瘤医院接受手术治疗的299例的Ⅰ-ⅢA期NSCLC患者,构成NCC队列,评估了预测模型用于复发风险分层的有效性。结果:SEER队列和CMU队列的中位随访时间分别为43个月(范围1-155个月)和44个月(范围1-143个月),5年癌症特异性累积生存率(accumulative cancer-specific survival,ACS)分别为72.8%和68.6%。随着时间的推移,患者死亡风险(hazardrate of death,HR)增加,SEER队列和CMU队列分别在第18个月(HR=0.0064)和第14个月(HR=0.0108)达到峰值,然后随着时间的推移而下降。相应地,以3年CPCS为例,SEER队列的3年CPCS逐步升高,从第0年的80.9%逐渐升高到第五年的89.6%,而ACS则逐步降低,从第0年的100%逐渐下降到第八年的65.2%。Ⅰ期建模队列、内部验证队列、CMU队列分别含有14293例、9531例、159例患者,ⅡA-ⅢA期建模队列、内部验证队列、CMU队列分别含有5650例、3767例、188例患者。预测模型的校正曲线显示预测的生存率与实际的生存率有较好的一致性。Ⅰ期NSCLC的发展队列、内部验证队列和CMU队列的C指数分别为0.67、0.67、0.77。ⅡA-ⅢA期NSCLC的建模队列、内部验证队列和CMU队列的C指数分别为0.62、0.64、0.69。DCA曲线显示预测模型具有一定的临床实用性。NCC队列共含有299例患者,其中Ⅰ期和Ⅱ-ⅢA期患者分别为212例和87例。中位随访时间为37个月(范围1-102个月),5年无复发生存率为66.4%,复发风险呈单峰模式,在术后8个月达到峰值,然后随着时间的推移而下降,在术后50个月左右存在小高峰。将NCC队列按照3-year CPCS分为高风险组、中风险组和低风险组后,高风险组、中风险组和低风险组的病例数分别为98、172和29例,其中复发的病例数分别为5、60和10例。低风险组复发风险一直处于较低水平,中风险组复发风险变化呈明显的单峰模式,而高风险组的复发变化趋势呈波浪型。预测模型可以较好地将低复发风险的患者人群和中高复发风险的患者人群进行区分。结论:本研究首次构建了用户友好的网络预测模型,能够对NSCLC术后患者的CPCS进行个体化评估,具有较高的校准度和区分度以及临床实用性,可将低复发风险人群和高复发风险人群有效地进行区分。应用我们的网络预测模型可能有助于肿瘤学家评估癌症特异性的动态生存率和制定个体化的术后随访策略,特别是对于长期幸存者而言。第二部分 SHC1表达及其部分甲基化位点是潜在的可用于评估LUAD预后的生物标志物目的:SHC1(SHC adaptor protein 1)是一种支架蛋白。本研究旨在探索SHC1及其甲基化位点是否有潜力作为可预测NSCLC预后的生物标志物,以期可与预测模型联合使用,提高模型的准确性和特异性。方法:我们使用Oncomine数据库、肿瘤免疫评估资源(Tumor Immune estimate Resource,TIMER)数据库和人类蛋白质图谱(Human Protein Atlas,HPA)数据库评估SHC1在正常组织和肺癌组织中的表达水平,并在15对NSCLC组织及配对的癌旁组织中通过实时定量PCR进行验证。利用Kaplan-Meier Plotter数据库和GEPIA2数据库分析肺腺癌(Lung adenocarcinoma,LUAD)和肺鳞癌(Lung squamous cell carcinoma,LUSC)中 SHC1 与预后的关系,并采用 Kaplan-Meier Plotter数据库分析不同临床病理因素下LUAD和LUSC中SHC1表达与预后的相关性,计算危险比(HR)及其95%置信区间和logrank p值。使用Wanderer数据库评估LUAD和LUSC患者的SHC1整体甲基化水平。为了进一步研究每个甲基化探针水平与预后的关系,我们使用MethSurv数据库进行预后分析。结果:通过Oncomine数据库、TIMER数据库和HPA数据库的评估,我们发现与正常组织相比,LUAD和LUSC组织中SHC1 mRNA和蛋白表达水平均明显升高。进一步地,我们通过qRT-PCR对SHC1 mRNA在15对NSCLC和癌旁组织中的表达进行了评估,发现SHC1 mRNA在肺腺癌和肺鳞癌中均表达较癌旁组织增高,与数据库预测结果一致。Kaplan-Meier Plotter数据库和GEPIA2数据库分析表明,在LUAD中,SHCl高表达的患者预后不良,而在LUSC中SHC1不同表达的患者预后未见显著差异。使用Kaplan-Meier Plotter数据库进一步亚组分析显示,SHC1高表达与女性患者和M0期患者的预后较差相关。此外,SHC1高表达与Ⅰ期和Ⅱ期肺癌患者的预后更差相关,但在Ⅲ期患者中未见显著差异。使用Wanderer数据库对SHC1甲基化水平进行评估,在LUAD数据集中,探针水平分析在LUAD组织中SHC1选定区域发现了 10个明显的高甲基化探针(cg07818949、cg00147095、cg09025625、cg24927174、cg06186450、cg04995846、cg22018051、cg16254756、cg19356022 和 cg25603883);在 CpG 岛中,cg10892866、cg02341811、cg25151638、cg15556748 和 cg02293828 也显示 LUAD 组织与正常组织之间的甲基化水平存在差异。在LUSC数据集中,探针水平分析在LUSC组织中SHC1选定区域发现了 9个明显的高甲基化探针(cg07818949、cg00147095、cg09025625、cg24927174、cg06186450、cg04995846、cg22018051、cg16254756和 cg02576073);在 CpG 岛中,cg10892866、cg14024356、cg27105205、cg02341811、cg24683561、cg18188585、cg01277844、cg25251638、cg15556748、cg00915289和cg00993057在LUSC组织和正常组织之间的甲基化水平存在差异。MethSurv数据库中的生存分析显示,LUAD 中 cg04995846、cg06186450、cg24927174、cg12473916、cg19356022和cg25603883的甲基化水平高的患者预后较好,LUSC中cg07818949、cg12473916和cg19356022的甲基化水平高的患者预后较好。结论:本研究首次探索了SHC1及其甲基化在LUAD和LUS中的临床意义。SHC1表达与cg12473916和cg19356022甲基化水平或许可以为LUAD提供更准确的预后信息,但对LUSC的预后预测能力可能有限。