论文部分内容阅读
目的:利用基因表达公共数据库(Gene Expression Omnibus,GEO)筛选获得具有预后价值的目的基因,并判断其作为胃癌预后标志物的可能性。应用支持向量机(Support Vector Machines,SVM)建立胃癌SVM生存预警模型,在术前指标中,找出预测胃癌患者术后生存时间的最优组合,并评估该模型预测胃癌患者术后生存时间的能力,为临床应用奠定基础。方法:(1)首先利用GEO数据库下载符合研究目的的基因表达数据谱GSE66229并对数据进行补缺和矫正。(2)然后使用以下方法筛选目的基因:差异表达基因分析、生存分析、单因素Cox回归分析、Lasso回归分析、最优子集回归分析(Best Subset Regression,BSR)和多因素Cox回归分析。(3)应用R语言软件进行SVM运算,构建术前最优胃癌SVM生存预警模型。(4)通过ROC曲线、生存曲线和Hosmer-Lemeshow拟合优度检验分析结果可视化——校准曲线,在肿瘤基因组图谱计划(The Cancer Genome Atlas Program,TCGA)及内部数据集中评估胃癌SVM生存预警模型预测胃癌患者术后生存时间的效能力。(5)采用实时定量PCR(Quantificational real time-PCR,q RT-PCR)、蛋白质印迹法和免疫组织化学等实验技术检测预后模型中的关键基因在胃癌组织中的表达水平;采用卡方检验和Fisher精确检验分析关键基因的表达与患者临床特征及预后之间的相关性。(6)经基因群富集分析(Gene Set Enrichment Analysis,GSEA)和CIBERSORT算法探索胃癌SVM生存预警模型中关键基因影响胃癌发生发展的机制。结果:(1)筛选获得潜在的胃癌预后标志物分别为α2型三磷酸腺苷酶(ATPase alpha 2,ATP1A2)、隐钙素2(Calsequestrin 2,CASQ2)、基质金属蛋白酶12(Matrix Metallopeptidase 12,MMP12)、联丝蛋白(Synemin,SYNM)、速激肽1(Tachykinin-1,TAC1)。(2)建立胃癌SVM生存预警模型:性别、年龄、Lauren分型、CASQ2、SYNM、亚洲癌症研究小组(Asian Cancer Research Group,ACRG)胃癌分子分型。该模型预测训练组、验证组、测试组胃癌患者预后的敏感性分别为89.86%、75.76%、78.67%,特异性分别为81.03%、40.58%、47.54%。(3)在内部、外部数据集中评估胃癌SVM生存预警模型,ROC曲线判断该模型的准确性的AUC分别为0.705、0.709;Kaplan-Meier法示高、低死亡风险组之间生存曲线不同且差异具有统计学意义(Log Rank P=0.003、Log Rank P<0.001)。Chi-square=8.952,P=0.346>0.05、Chi-square=5.917,P=0.657>0.05为内、外部数据集中Hosmer-Lemeshow拟合优度检验分析结果,说明当前模型和理想中的完美模型没有统计学差异,是可接受的。(4)根据q RT-PCR证实了在胃癌组织中CASQ2和SYNM的m RNA表达降低(P<0.05,P<0.001),并且蛋白质印迹法显示与胃癌组织相比,正常组织中CASQ2和SYNM的蛋白质表达量增加(P<0.05,P<0.001)。(5)免疫组织化学实验观察到CASQ2和SYNM在正常组织中弥漫性的细胞质染色,而在胃癌组织中大部分细胞质及细胞核未染色,少量组织中出现细胞质淡染的情况(χ~2=150.048,P<0.001;χ~2=136.433,P<0.001),且均与患者的与患者的Lauren分型、肿瘤的侵袭、淋巴结转移、远处转移、临床分期等临床特征及预后显著相关。(6)CASQ2和SYNM的m RNA高表达样本均富集在细胞外基质(Extracellular Matrix,ECM)受体相互作用、白细胞穿透迁移和TGF-β信号通路,并且均与CD4+的记忆T细胞、NK细胞、M0巨噬细胞和中性粒细胞等多种免疫细胞存在相关性。结论:本研究通过生物信息学分析获得ATP1A2、CASQ2、MMP12、SYNM、TAC1这五个基因,他们与胃癌患者预后相关,并且可能成为潜在的预后标志物,并且首次提出建立胃癌SVM生存预警模型可以从“基因-蛋白质-组织”三个层面进行评估:基因(ACRG胃癌分子分型)-蛋白质(CASQ2、SYNM)-组织(Lauren分型)三个层面的分别进行评估,这不仅有利于提示医疗工作者即时调整治疗方案,也有利于为胃癌患者制定独特的医疗计划,如最佳的术后放化疗方案和合理的复查时间。胃癌SVM生存预警模型中的CASQ2和SYNM可能通过ECM受体相互作用、白细胞穿透迁移和TGF-β信号通路影响着胃癌的发生及发展。除此之外,CASQ2、SYNM的m RNA高表达组中CD4+的记忆T细胞浸润丰富,而NK细胞、M0巨噬细胞、中性粒细胞等免疫细胞浸润匮乏,可能籍此改变免疫微环境而影响胃癌的发生与发展。