论文部分内容阅读
目的基于生物信息数据库筛选肺腺癌诊断和预后相关基因,生物信息学分析结合组织芯片技术探索候选基因H2AX在肺腺癌中的诊断和预后价值。方法从TCGA门户网站下载肺腺癌m RNA表达谱数据和临床数据,利用R软件的“Limma”包分析筛选肺腺癌差异表达基因;通过R软件的“Survival”包批量筛选肺腺癌预后相关基因;以受试者工作特征(ROC)曲线下面积>0.6为基因具有预测预后能力的标准进一步筛选肺腺癌预后相关基因;分析预后相关基因与肺腺癌临床病理特征(年龄、性别、是否吸烟、T分期、N分期、M分期、TNM分期)的相关性;确定候选基因H2AX。采用Wilcoxon秩和检验分析H2AX m RNA在肺腺癌与正常组织、肺腺癌与肺鳞状细胞癌组织中的表达差异,以GEO数据集验证TCGA数据集的分析结果;分别采用Kaplan-Meier法、COX风险回归模型法分析H2AX m RNA表达与肺腺癌预后的相关性;采用GSEA软件对H2AX进行基因集富集分析,预测H2AX基因的相关功能。以75对肺腺癌和癌旁组织、60对肺鳞状细胞癌和癌旁组织制作2张组织芯片微阵列,利用免疫组织化学染色判定H2AX蛋白表达水平,采用Wilcoxon秩和检验分析H2AX蛋白在肺腺癌与癌旁组织、肺腺癌与肺鳞状细胞癌组织中的表达水平差异。对75例肺腺癌患者进行临床随访,采用Kaplan-Meier法分析H2AX蛋白表达水平与患者预后的相关性。结果1、由TCGA肺腺癌数据集共筛选出7842个差异表达基因,其中5975个基因表达上调,1867个基因表达下调;共筛选出13个肺腺癌预后相关基因。2、TCGA肺腺癌数据集、GSE75037、GSE116959中均证实了H2AX基因在肺腺癌与正常组织中差异表达,肺腺癌组织中H2AX m RNA表达高于正常组织,差异具有统计学意义(P=5.505e-26;P=2.960e-22;P=2.246e-6)。3、TCGA肺腺癌数据集、GSE115457、GSE103584中均证实了肺鳞状细胞癌组织中H2AX m RNA表达高于肺腺癌组织,差异具有统计学意义(P=2.347e-38;P=5.965e-4;P=0.023)。4、Kaplan-Meier生存分析显示,TCGA肺腺癌临床数据完整的364例肺腺癌患者中,H2AX m RNA高表达组总生存率较低表达组低,差异具有统计学意义(P<0.0001,HR=1.010,95%CI:1.004~1.018)。5、COX风险回归模型单因素分析显示,肿瘤分期、T分期、N分期、M分期和H2AX表达与肺腺癌预后相关(P均小于0.05,HR及HR的95%CI均大于1);多因素回归分析显示,T分期和H2AX表达与肺腺癌预后相关(P=0.038,HR=1.282,95%CI:1.014~1.620;P=0.002,HR=1.417,95%CI:1.133~1.771)。6、H2AX基因高表达在细胞周期、嘧啶代谢、剪接体、碱基切除修复、同源重组、DNA复制、错配修复、蛋白酶体、P53信号通路中显著富集(P均小于0.05,FDR均小于0.25)。7、肺腺癌中H2AX蛋白表达较肺腺癌癌旁组织中水平高,差异具有统计学意义(P=0.000);肺鳞状细胞癌中H2AX蛋白表达较肺腺癌中水平高,差异具有统计学意义(P=0.002)。8、Kaplan-Meier生存分析显示,H2AX蛋白表达水平与肺腺癌3年总生存率存在差异,差异具有统计学意义(P=0.028)。结论1、H2AX基因表达可作为肺腺癌诊断的潜在生物标记物。2、H2AX基因表达可作为非小细胞肺癌亚型(肺腺癌与肺鳞状细胞癌)鉴别诊断的潜在生物标记物。3、H2AX m RNA高表达与肺腺癌预后不良相关,且为肺腺癌的独立预后因素。4、H2AX基因可能通过参与肺腺癌的细胞周期、基因损伤的修复及相关信号通路,在肺腺癌的发生发展中起到了一定的作用。5、H2AX蛋白免疫组织化学染色可以作为肺腺癌诊断、与肺鳞状细胞癌鉴别诊断的指标。6、H2AX蛋白表达升高是肺腺癌患者的不良预后因素。