以高风险癌前疾病与肝细胞癌差异表达基因为基础构建肝细胞癌风险预后模型的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:bbs_zj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景:肝细胞癌(HCC)是全球范围内最常见的恶性肿瘤之一,由于HCC早期症状不明显,很多患者一经发现已经处于HCC晚期阶段,失去手术治疗的机会,因此探索新的HCC诊疗策略极为迫切。在我们先前的研究中发现,伴随着肝炎、肝硬化等慢性肝病背景下的肝脏不典型增生结节(DN)具有一定的癌变风险。因此我们首次提出一个新的概念肝癌癌前疾病(Pre-HCC),包括低级别不典型增生结节(LGDN)和高级别不典型增生结节(HGDN)。其中,相比于LGDN,HGDN具有更高的HCC发病率而被认为是高风险的Pre-HCC。但是,高风险Pre-HCC恶变过程中的关键基因和潜在的调控通路尚不明确。研究目的:本研究应用GEO、TCGA、ICGC数据库进行生物信息学分析,旨在(1)通过生物信息学方法筛选高风险Pre-HCC与HCC的差异表达基因,探究高风险Pre-HCC恶性转换的关键基因与潜在的分子调控机制。(2)根据差异表达基因构建HCC生存预测模型并评估其效能,分析生存预测模型与临床特征的关系,探究生存预测模型与肿瘤微环境的相关性。方法:(1)通过GEO数据库获得GSE89377、GSE6764芯片数据,应用R语言包“limma”对基因数据进行差异表达分析,获得高风险Pre-HCC和HCC之间的差异表达基因。使用R语言包“cluster Profiler(version 3.14.3)”对筛选出的差异表达基因进行GO和KEGG基因功能富集分析。(2)在STRING数据库中构建差异表达基因的蛋白质-蛋白质互作网络图谱(PPI),应用Cytoscape3.7.2软件中cytoHubba插件,得到前10个显著差异表达的基因。通过TCGA数据库下载365个肝癌患者的基因数据及临床数据作为训练集,对前10个基因进行单因素和多因素分析,使用R软件包glmnet,用lasso-cox方法构建最优肝癌生存预测模型。(3)依据生存预测模型将TCGA肝癌患者分为高危组、低危组,使用R软件包“survival”绘制K-M生存曲线和ROC曲线评估肝癌生存预测模型的预测价值。(4)我们还分析了 TCGA肝癌患者的临床特征与肝癌生存预测模型的相关性。同时应用ICGC数据库中的235个肝癌患者作为验证集对肝癌生存预测模型进行外部验证。(5)此外,我们计算TCGA肝癌患者中22种免疫细胞和2种基质细胞的细胞评分用以分析高低危两组的肿瘤微环境差异。(6)我们通过 GSEA 网站获得了 GSEA 软件,并从 Molecular Signatures Database下载了 KEGG通路集合,阐明了高危组和低危组的通路整体变化。结果:(1)从GSE89377、GSE6764两组数据集筛选出高风险Pre-HCC和HCC共同差异表达基因268个(57个上调基因,211个下调基因)。GO、KEGG基因功能富集结果表明,差异基因与细胞外结构、多种催化酶活性、多种代谢过程(如脂质代谢、氨基酸代谢等)、补体凝血级联通路、PPAR信号通路、细胞周期和DNA复制密切相关。(2)通过 cytoHubba 分析,AURKA、AURKB、NUSAP1、MELK、CCNB2、PRC1、TOP2A、PTTG1、UBE2C、NCAPG是高风险Pre-HCC和HCC之间的前10个显著表达基因并均是影响肝癌不良预后的危险因素,Lasso-cox回归分析最终获得了 4个基因构建的模型:(Risk Score=-0.3852*NUSAP1+0.2149*MELK+0.1346*PTTG1+0.5585*NCAPG)(3)依据模型的风险评分将肝癌患者分成高危组和低危组,Kaplan-Meier生存曲线显示高危患者具有更差的预后,且组间具有显著生存差异(p=5.4e-7)。同时ROC分析结果显示,生存预测模型预测1、2、3、5年总体生存率的AUC(95%置信区间)分别为0.76(0.83-0.69)、0.74(0.80-0.67)、0.71(0.79-0.64)、0.70(0.79-0.61),说明该模型对预测HCC患者早期生存具有较好的预测能力。(4)单因素和多因素分析结果表明:越差的肿瘤结节状态、越晚的肿瘤分期、BMI降低、AFP升高、高风险分数与肝癌的不良预后相关(P<0.05)。而性别、年龄、病理分级、Child分级、纤维化分级与肝癌预后无关。(5)在验证集中生存分析显示高危组总体生存率明显低于低危组(p=3.4e-5),生存预测模型预测1、2、3年总体生存率的AUC(95%置信区间)分别为0.70(0.84-0.57)、0.72(0.82-0.62)、0.70(0.81-0.59),说明在验证集中,该模型对预测HCC患者早期生存也具有较好的预测能力。(6)另外肿瘤微环境分析显示,风险分数与记忆B细胞、滤泡辅助T细胞、调节性T细胞(Treg)、巨噬细胞MO评分呈正相关,相关系数分别为0.17、0.33、0.16、0.30;而与幼稚B细胞、静息CD4记忆T细胞、单核细胞、巨噬细胞M1型、内皮细胞、成纤维细胞评分呈负相关,相关系数分别为-0.25、-0.21、-0.19、-0.10、-0.26、-0.10。(7)为了进一步探讨分子通路与HCC患者预后之间的关系,我们采用GSEA分析来评估高低危两组中通路的整体变化趋势。与低危组相比,高危组中p53信号通路、细胞周期、DNA复制相关的通路表达显著增高,而胆汁酸代谢、脂肪酸代谢、补体与凝血级联、药物代谢细胞色素P450和PPAR信号通路显著降低。结论:根据生物信息学分析结果,NUSAP1、MELK、PTTG1、NCAPG是高风险Pre-HCC恶性转变的潜在关键基因,是肝癌不良预后的危险因素。我们利用Lasso-cox回归模型建立了一个四基因的肝癌生存预后预测模型,同时内部验证和外部验证结果均表明模型对预测HCC早期生存情况具有良好的预测能力。此外,肿瘤微环境中多种细胞间相互作用失衡可影响肝癌患者预后。这些研究结果为Pre-HCC的临床和基础研究提供新的思路和研究基础,具有重要意义。
其他文献
研究背景及目的技术背景CT三维重建技术是指使用计算机处理技术对计算机断层扫描(computed tomography,CT)图像进行特征提取和三维重建的技术。它是一种显示、描述和解释器官三维解剖和形态特征的工具,从而为临床决策提供直观、立体和准确的评估方法。CT三维重建技术在肝病的诊断和治疗中发挥着越来越重要的作用。近年来,CT三维重建技术在进行肝切除术前评估、模拟肝切除手术、门静脉血流量及流速测
学位
如今我国高速铁路发展迅猛,高铁已经成为我国交通运输的主要方式之一。为了适应铁路运营日益增加的复杂性,铁路总公司提出了建设高速铁路供电安全检测监测系统(6C系统)的总体目标。其中高铁接触网作为沿铁路线架设的为电力机车提供电源的特殊供电装置,高铁接触网悬挂状态检测监测(4C系统)是保障接触网整体安全的关键一环。目前铁路部门通过接触网悬挂状态检测监测系统对包括管帽在内的接触网零部件进行现场的拍照收集并通
学位
背景:肺癌是人类最常见的恶性肿瘤之一,也是截至目前全世界癌症相关死亡的最主要原因之一。非小细胞肺癌(non-small cell lung cancer,NSCLC)则是肺癌中最常见的类型(占比约85%)。尽管近几年肺癌的综合治疗取得了很大的进步,尤其是以靶向程序性细胞死亡蛋白1(programmed cell death protein 1,PD-1)及其配体PD-L1的单克隆抗体为代表的免疫治
学位
当今社会,电力已经变成了人类生活必要的基本资源,保障电力的稳定供应对经济生产和国民生活有着至关重要的意义。作为电网输电、变电、配电环节中的关键一环,高压输电线路在其中扮演着至关重要的角色。导线舞动,是指架空输电线路在风速等自然条件的影响下出现的一种自激震荡现象,剧烈的导线舞动可能会引发导线断股、线路跳闸、绝缘子损坏、甚至造成杆塔倒塌等事故。随着图像处理和计算机视觉等新技术的蓬勃发展,基于影像和视频
学位
风电在实现“双碳”目标中发挥着重要作用,然而风电具有较强的随机性和波动性,大规模风电接入电网会影响电网运行的安全性以及稳定性。因此开展高精度的风电功率预测技术研究,对提高风电消纳能力和电力系统的安全稳定运行具有重要意义。风电功率预测方法分为单值预测和概率预测,其中单值预测方法可以得到待预测时刻的风电功率期望值,该方法比较成熟但无法定量描述风电功率预测的不确定性。概率预测方法作为单值预测的延伸,可以
学位
目前,新型冠状病毒肺炎正在全世界范围传播,给各国人民身体健康和生命安全带来巨大威胁,对世界经济发展的负面冲击不断扩大和加深。在这场看不见敌人且没有硝烟的战争中,先进的信息技术起着重要的作用。抗击COVID-19有效的方法是隔离被感染者并精准追踪密切接触者。最近,有工作提出基于蓝牙的联系人追踪方案,以追踪到感染者的密切接触者,从而尽快控制新冠病毒的传播。然而,现有的密切接触者追踪系统带来了较为昂贵的
学位
目的:通过研究山东省经济发展水平和肺结核登记发病率之间的相关性,为政府防控肺结核病提供更多的研究依据。方法:通过分析面板数据、构建固定效应模型和门限回归模型,我们研究了 2006-2017年间中国山东省17地市不同经济因素与肺结核登记发病率之间的相关性并且对不同经济发展水平地区之间肺结核登记发病率的差异进行了分析比较。结果:在所研究的经济因素中,人口密度、人均医疗财政支出、农村人均年收入、城市人均
学位
目的探讨多中心循证质量改进(evidence-based practice for improving quality,EPIQ)项目对极低出生体重儿(very low birth weight infants,VLB WIs)即出生体重<1500g的婴儿入院低体温及相关并发症的影响,为新生儿重症监护病房(neonatal intensive care units,NICUs)早产儿入院低体温持续
学位
背景脓毒症(Sepsis)是一种由病原感染所引起的全身炎症反应综合征,常合并器官功能障碍,是临床常见的危重症,心肌损伤(Sepsis-induced Myocardial Dysfunction,SIMD)是其最严重的并发症之一。目前临床上关于SIMD的治疗手段有限,随着对脓毒症及SIMD的发病机制的研究深入,目前已有关于其对因治疗的潜在药物或治疗方案,但均尚不成熟。因此,寻找SIMD的靶向治疗方
学位
目的:慢性淋巴细胞白血病(chronic lymphocytic leukemia,CLL)是一种惰性淋巴细胞增殖性疾病。然而,在部分具有TP53突变/缺失、未突变免疫球蛋白重链可变区基因(immunoglobulin heavy chain variable region,IGHV)及高 β2微球蛋白(β2-microglobulin,β2-MG)等高危因素的CLL患者中,其病程呈侵袭性。近年来
学位