论文部分内容阅读
目的:在中国,肺癌是目前发病率和死亡率最高的恶性肿瘤之一,非小细胞肺癌(non-small cell lung cancer,NSCLC)是一种异质性肿瘤,约占所有肺癌的85%,由于其早期和局限性病变,通常通过手术切除,然而,由于非小细胞肺癌的隐匿性发作,使得大部分病人在被诊断为肺癌时就已处于晚期(IIIb期/IV期),此时他们已失去手术的机会。化疗仍然是非小细胞肺癌治疗的金标准,然而,大多数患者对于以顺铂为代表的铂类化疗药物敏感,可以减轻早期症状,但后期疗效不佳,显示出肿瘤细胞的多药耐药性的特点,导致非小细胞肺癌化疗失败。因此本研究通过生物信息学研究与分析,筛选与非小细胞肺癌铂类化疗预后相关的生物标志物,即铂类药物化疗敏感性基因,为非小细胞肺癌患者的预后评价提供更多的参考依据。方法:1.从癌症基因组图谱(The Cancer Genome Atlas,TCGA)中下载非小细胞肺癌(肺腺癌,肺鳞癌)患者基因表达数据和临床相关资料,R语言edge R包根据肺腺癌或肺鳞癌组织与正常组织的m RNA的表达差异,筛选出差异基因(FDR<0.05,|log2FC|>1)。2.对差异基因的潜在预后价值进一步探究,利用R语言Limma包,单多因素COX分析构建肺腺癌潜在的风险模型。3.对差异基因的潜在预后价值进一步探究,利用R语言Limma包,单多因素COX分析构建肺鳞癌潜在的风险模型。4.将与肺鳞癌相比,特异存在于肺腺癌的上调差异基因进行GO富集分析和KEGG分析,寻找这些基因可能存在的通路;将与肺腺癌相比,特异存在于肺鳞癌的上调差异基因进行GO富集分析和KEGG分析,寻找这些基因可能存在的通路。5.将与肺鳞癌相比,特异存在于肺腺癌的上调差异基因进行蛋白互作网络分析,来探究这些基因所编码的蛋白质是否有相互作用;将与肺腺癌相比,特异存在于肺鳞癌的上调差异基因进行蛋白互作网络分析,来探究这些基因所编码的蛋白质是否有相互作用。6.使用“Survival”R包进行Kaplan–Meier生存分析,根据非小细胞肺癌5年的总体生存率,用于确定与非小细胞肺癌预后相关的铂类化疗药物敏感性基因。7.使用“survival ROC”R包进行了随时间变化的接收者操作特征曲线(Receiver Operating Characteristic,ROC),以评估该预后风险评分模型的预测准确性,筛选具有铂类化疗药物敏感性的潜在生物标记物(高表达、预后好)的m RNA。结果:1.将TCGA数据库中下载的临床相关资料进行整理,筛选出14份正常组织和119份经铂类化疗的肺鳞癌组织样本,34份正常组织和383份未经铂类化疗的肺鳞癌组织样本;12份正常组织和151份经铂类化疗的肺腺癌组织样本,46份正常组织和376份未经铂类化疗的肺腺癌组织样本。将其转录组数据经R语言edge R包分析结果发现,经铂类化疗和未经铂类化疗的临床病例中,肺腺癌经铂类化疗上调的差异基因有165个,未经铂类化疗上调的差异基因有99个;肺磷癌经铂类化疗上调的差异基因有380个,未经铂类化疗上调的差异基因有391个。进一步通过Venn图分析得到与肺鳞癌相比,特异存在于肺腺癌经铂类化疗和未经铂类化疗的病例中均显著上调的差异表达基因有39个;与肺腺癌相比,特异存在于肺鳞癌经铂类化疗和未经铂类化疗的病例中均显著上调的差异表达基因有257个(P<0.05)。2.将从TCGA数据库中筛选得到的与肺鳞癌相比,特异存在于肺腺癌中经铂类化疗和未经铂类化疗的病例中均显著上调的39个差异表达基因进行了单多因素Cox回归模型生存分析,总共显示特异存在肺腺癌中可以作为独立变量的差异基因有5个(P<0.05)。3.将从TCGA数据库中筛选得到的与肺腺癌相比,特异存在于肺鳞癌中经铂类化疗和未经铂类化疗的病例中均显著上调的257个差异表达基因进行了单多因素Cox回归模型生存分析,总共显示特异存在肺磷癌中可以作为独立变量的差异基因有22个(P<0.05)。4.将与肺鳞癌相比,特异存在于肺腺癌的5个上调差异基因进行GO富集分析和KEGG分析,得到TFF1基因在BP通路中富集,HTR3A在CC通路中富集,TMEM63C和HTR3A这两个基因在MF通路中富集,并参与多个信号通路。将与肺腺癌相比,特异存在于肺磷癌的22个上调差异基因进行GO富集分析和KEGG分析,得到其中DLX5,EFNA3,FOXD1,SHOX2,CDCA2,ESCO2,NDC80基因主要在BP通路中富集,CTSV,SERPINB13,C1QL1,NDC80,PLAAT1主要在CC通路中富集,DQX1,POLQ,ESCO2,PLAAT1,GDA,CTSV,HAP1主要在MF通路中富集。5.将与肺磷癌相比,特异存在于肺腺癌的5个上调差异基因进行蛋白互作网络分析,研究发现,这五个基因编码的蛋白质之间没有相互作用(P<0.05)。将与肺腺癌相比,特异存在于肺磷癌的22个上调差异基因进行蛋白互作网络分析,发现有7个基因编码的蛋白质之间有相互作用,包括PQLQ,NDC80,CDCA2,ESCO2,CTSV,SERPINB13和CLCA2(P<0.05)。6.根据风险评分的中位数把肺腺癌患者分成高、低表达组。使用“Survival”R包进行Kaplan–Meier生存分析肺腺癌5年生存率,KM分析显示,有0个基因与肺腺癌患者预后显著相关(P<0.05)。同方法根据风险评分中位数将肺鳞癌患者分成高、低表达组。使用“Survival”R包进行Kaplan–Meier生存分析肺鳞癌5年生存率,KM分析显示,有6个基因与肺磷癌患者预后显著相关(P<0.05),包括PLATT1,SERPINB13,SHOX2,AC010280.1,C1QL1,CLCA2,这六个基因高表达,肺鳞癌经铂类化疗的OS长,预后好。7.通过计算ROC曲线下的面积(Area Under Curve,AUC)评估了肺鳞癌患者模型的预测能力,得到SERPINB13基因预测肺鳞癌患者生存期的5年的AUC值为0.627(P<0.05),表明该风险评估模型可以作为预测肺鳞癌预后的有效标志模型,SERPINB13基因可以作为肺鳞癌铂类化疗药物敏感性基因,并且SERPINB13在肺鳞癌中表达越高,肺鳞癌患者预后效果越好。结论:肺鳞癌中SERPINB13基因高表达,对经铂类化疗的肺鳞癌的生存期显示良好的预后,因此可能作为肺鳞癌铂类药物化疗敏感性的特异标志物,可能预示铂类药物化疗后预后良好,有一定的临床应用价值。