论文部分内容阅读
目的:肝细胞癌(Hepatocellular carcinoma,HCC)是一种多在中晚期发现,死亡率高,患者预后极差的常见癌症。因此,我们的研究目的是分析HCC患者的lncRNA表达谱,筛选与HCC预后密切相关的潜在lncRNA,为寻找HCC预后生物标记物提供新思路。方法:在美国癌症肿瘤基因图谱数据库下载424例基因表达数据,其中包括374例肝癌组织及50例癌旁正常组织。利用Perl语言和R语言的limma包进行数据预处理。对纳入研究的患者利用Caret包随机分为训练集和测试集。采用edgeR包筛选差异表达的lncRNA,通过单因素COX回归分析、LASSO回归和多因素COX分析筛选出lncRNAs并构建预后模型,Kaplan-Meier生存分析、受试者工作曲线分析预后模型评估患者预后的能力;二分类逻辑回归建立诊断模型,受试者工作曲线分析评价诊断效能。风险评分与临床资料的相关性采用卡方检验进行分析;单因素和多因素COX回归分析进一步分析包括患者的预后风险评分和临床资料在内的各个因素与患者生存之间的相关性;配对差异分析明确AC007998.3的表达情况;Kaplan-Meier生存分析、受试者工作曲线明确AC007998.3对患者预后的影响;逻辑回归分析AC007998.3表达与临床资料的相关性。功能富集分析探究lncRNA的功能。结果:1、差异分析结果显示共有1486个lncRNA表达失调,其中1338个显著上调和148个显著下调的lncRNA。单因素COX回归分析筛选出与患者预后相关的191个lncRNA,LASSO回归对191个lncRNA进一步筛选得到33个候选的lncRNA。2、多因素COX回归分析从33个候选的lncRNA中筛选出13个lncRNA,并建立了预后模型。在训练集和两个验证集中,低风险组的平均生存时间均高于高风险组(3124 vs 649天,2456 vs 770天和3124 vs 755天),1年、3年和5年的生存预测ROC曲线下面积均高于0.75。单因素和多因素COX回归分析结果显示,仅风险评分与患者的生存情况密切相关,且p值均小于0.0001。3、二分类逻辑回归基于13个lncRNA的表达建立诊断模型,三个数据集中诊断ROC曲线下面积分别为0.9478、0.9265和0.9376。4、功能富集分析表明13个lncRNA参与了细胞周期的调控以及多条代谢途径等过程。5、AC007998.3在HCC组织中显著高表达,高表达组和低表达组的平均生存时间分别为1135和2132天。1年、3年和5年的生存预测ROC曲线下面积分别为0.6105、0.6212和0.5634。功能富集分析表明AC007998.3参与细胞外基质的构成、胶原蛋白的合成等重要的生物过程,以及PI3K-Akt等重要的信号通路。结论:1、筛选出与患者预后密切相关的13个lncRNA:SREBF2-AS1、MIR3945HG、AC015908.3、AL162413.1、SERTAD4-AS1、GEMIN7-AS1、AP002478.1、ADGRD1-AS1、AC016717.2、AC007998.3、AC025271.4、AC004687.1以及LINC01370;2、基于13个lncRNA建立的预后模型具有较好的预测能力,可独立于临床资料预测HCC患者的预后情况;3、基于13个lncRNA建立的诊断模型能够准确地区分肝癌组织及其正常组织,具有一定的诊断价值;4、在HCC组织中,AC007998.3显著高表达,同时AC007998.3高表达的患者预后较差。