论文部分内容阅读
目的基于癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库,运用Cox比例风险回归模型及弹性网络算法筛选与胃癌预后相关的关键长链非编码RNA(long non-coding RNA,lncRNA),并构建胃癌预后lncRNA预测模型。方法下载TCGA数据库中407例胃癌RNA测序(RNA sequencing,RNA-Seq)数据及相应临床预后资料,将数据处理及整合后随机划分为训练集和测试集。利用训练集数据,通过单因素Cox比例风险回归模型筛选与胃癌预后相关的差异表达lncRNA;基于筛选结果,分别采用多因素Cox比例风险回归模型及弹性网络算法筛选胃癌预后相关关键差异表达lncRNA,进一步构建预测模型;绘制接受者操作特征曲线(Receiver operating characteristic,ROC)并计算ROC曲线下面积(Area under curve,AUC),以评价上述模型对胃癌患者预后的区分预测能力;基于上述模型计算各患者预后风险评分,取评分中位值作为截断值划分胃癌预后高低风险组,运用Kaplan-Meier法比较两组胃癌患者的生存差异,并通过Log-Rank法检验两组胃癌患者生存分布差异的显著性;利用测试集数据,分别对上述步骤中构建的胃癌预后lncRNA预测模型进行验证与评价。最后,对各模型中纳入的胃癌预后相关关键lncRNA分子进行靶基因预测。结果1本研究共纳入318例胃癌样本,筛选出1369个与胃癌预后相关的差异表达lncRNA,其中表达水平上调的有751个,表达水平下调的有618个。2基于Cox比例风险回归模型构建的32-lncRNA预测模型的AUC为0.827,在训练集中计算各患者风险评分后得到评分中位值为-13.007,以此为截断值进行高低风险分组,高风险组患者的总体生存期(Overall survival,OS)与低风险组患者相比显著降低(P<0.05),在测试集中二者无显著差异(P=0.22)。3基于弹性网络算法,确定最优调整参数α=0.1和λ=0.12时模型的均方根误差最小,共纳入19个lncRNA,构建了19-lncRNA预测模型,其AUC为0.831;在训练集及测试集中,高风险组患者的OS与低风险组患者相比均显著降低(P<0.05)。4运用starBase数据库进行胃癌预后相关关键lncRNA分子的靶基因预测分析发现,SLC7A2可能是HLX-AS1的靶基因,相关性分析提示HLX-AS1与SLC7A2在胃癌中具有密切相关性(r=0.306,P=1.52e-09)。结论胃癌预后19-lncRNA分子预测模型具有良好的稳定性及区分预测能力,可能为判断胃癌患者预后情况提供参考依据。图13幅;表5个;参147篇。