论文部分内容阅读
目的:统计PIK3CA突变在子宫内膜样腺癌(EEC)中的发生情况,研究PIK3CA突变与预后的关系,探索PIK3CA突变相关的分子机制,尝试以PIK3CA突变及突变相关的基因构建子宫内膜样腺癌的预后预测模型,用生信方法和实验方法验证模型的效能,开发模型应用于临床的工具,并且探索模型的分子机制。内容:从TCGA获取EEC患者相关信息,将患者分为PIK3CA突变组和野生组,比较两组患者的总生存(OS)和无进展生存(PFS)。筛选突变相关的差异表达基因(DEGs),再用卡普兰-迈耶(KM)生存分析和最小绝对值收敛和选择算子(LASSO)回归分析筛出预后相关的DEGs。将患者随机分为训练集和验证集。在训练集中建立COX回归模型,将患者分为高危组和低危组,对其进行生存分析、绘制时间受试者工作特征(ROC)曲线并计算曲线下面积(AUC),再在验证集验证。将风险评分模型与其它分子分型工具进行比较。对模型进行单因素和多因素cox回归分析,开发临床应用工具并验证。通过加权基因共表达网络分析,探索模型相关的分子机制,进行免疫细胞浸润分析,完成模型验证的部分实验。方法:所有的处理均通过R语言实现。数据的下载通过TCGAbiolinks实现;突变数据的分析由maftools实现;预后的比较通过KM生存分析实现;DEGs通过DESeq2获取;患者的随机分组通过Craret实现;连续型变量进行KM生存分析的最佳截断值通过survminer得到;COX分析、LASSO回归由R的基本函数实现;列线图和校准曲线通过rms绘制。加权基因共表达网络分析(WGCNA)由WGCNA包实现,免疫细胞浸润程度由GSVA计算。结果:在EEC患者中,PIK3CA突变的发生频率为50%;PIK3CA突变显著影响了EEC患者的OS和PFS,与预后良好有关;PIK3CA突变影响了EEC患者的基因表达水平,在PIK3CA突变组患者和PIK3CA野生型组患者之间的DEGs共有103个,进一步筛选后得到6个与预后相关的DEGs;在276例患者的训练集中构建了风险评分模型,得到了风险评分的公式。使用survminer得到风险分数的最佳截断值为1.18,根据这个值将分别将两组患者分为高危组和低危组;风险评分模型的预后价值在训练集和验证集中得到了体现,两组患者中高危组患者的OS都更差(P<0.05),训练集患者1年、3年、5年的ROC曲线,其AUC分别为:0.86、0.75、0.76,验证集患者1年、3年、5年的ROC曲线,其AUC分别为:0.69、0.78、0.75;我们证明了模型是独立预后因子;对本研究中涉及的患者来说,风险评分模型的预测价值优于TCGA分子分型,KM生存分析显示风险评分模型能将预后不同的患者区分开(P<0.05),而TCGA分子分型不能(P<0.05);我们构建了可用于临床的列线图,在训练集和验证集中利用此列线图预测患者5年生存率的一致性指数分别为0.83和0.74。发现一个与模型相关的基因模块,此模块与多个细胞信号传导过程相关。发现CD8+T细胞、Th1细胞和NK细胞与模型存在相关性。结论:PIK3CA突变与EEC预后良好有关,能显著影响预后,以PIK3CA突变及相关基因建立的预后预测模型与多个生物学过程和免疫细胞浸润程度相关。它在临床应用上有着潜在价值。