论文部分内容阅读
目的:3’端非翻译区(3’-UTR)是调节基因表达的重要元件,它可以在转录后基因调控水平上通过破坏调控元件结合和致癌基因表达失调来驱动或增强恶性肿瘤发病机制,但大多数研究集中在RNA结合蛋白(RNA-binding proteins,RBPs)、miRNAs、可替代聚腺苷酸化(alternative polyadenylation,APA)和RNA修饰的变化上。体细胞3’-UTR突变也可以破坏复杂的结构使mRNA表达失调,促进肿瘤的发生发展。因此,探究3’-UTR突变在转录后调控水平对肿瘤发生发展的影响是至关重要的。内容:我们收集了 18种恶性肿瘤的2413个样本的全基因组测序数据,以确定3’-UTR转录后水平有害的 SNVs(3’-UTR posttranscriptional impairment-related SNVs,3’-UTR piSNVs),这些SNVs在肿瘤样本中明显富集,并与患者生存率、免疫细胞、免疫检查点特征和典型的恶性肿瘤相关通路有关,我们进一步刻画3’-UTR piSNVs在泛癌中的综合特征,并预测相关的潜在治疗药物。方法:我们从PCAWG项目和我们实验室内部的食管鳞癌样本中18种恶性肿瘤的共2413个样本里下载得到全基因组测序(WGS)数据,以及对应的临床数据、mRNA数据和miRNA数据;然后我们使用我们更新的“PIVar”算法来识别3’-UTR piSNVs以及富集到的相关RBPs。同时,我们根据RMVar和APADB数据库对3’-UTR piSNVs的 RNA 修饰和 APA 变化进行注释,用 TargetScan、miRNASNP、starBase 和 miRDB软件确定3’-UTR piSNVs可能结合的miRNA;接着,我们按照3’-UTR piSNV的比率将肿瘤样本分为高/低两组,探究其与患者生存率、肿瘤免疫微环境和信号通路的关系;最后,我们使用“CMAP”软件在特定恶性肿瘤中确定了几种潜在的治疗化合物。结果:为了探索3’-UTR体细胞突变通过转录后调控在肿瘤发生发展过程中发挥的功能,我们收集了 18种恶性肿瘤(PCAWG项目和我们实验室内部的食管鳞癌(ESCC)数据)的2,413个样本的全基因组数据。通过我们更新的算法PIVar识别得到25,216个转录后水平有害的3’-UTRSNVs,包括2,930个3’-UTR piSNVs对应的基因;并且得到24个显著富集相关的RBPs。在所有18种恶性肿瘤中,体细胞3’-UTR piSNV比率明显增加,并且与四种恶性肿瘤的生存率降低有关。一些恶性肿瘤相关的基因似乎在蛋白质功能和转录后调控水平上促进肿瘤的发生,包括基因PREX2、ADAMTS12和PLXDC2;而一些3’-UTR piSNV影响的基因主要通过转录后机制发挥作用,包括RNF217、PGAM2、RBBP4、PIK3CA、CDYL2、EGFR 和 PIK3R2。此外,我们比较了 3’-UTR piSNV 比例高/低两组之间的免疫细胞和免疫检查点特征,并使用“CMAP”软件预测与3’-UTR piSNV影响的基因表达特征相关的80个化合物。结论:总之,我们的研究揭示了 3’-UTR piSNVs在恶性肿瘤中的普遍性和临床相关性,也证明除了影响miRNA结合,3’-UTR piSNVs还扰乱RBPs结合、APA和m6A RNA修饰,这强调考虑3’-UTR piSNVs在肿瘤生物学上的重要性。目的:食道鳞状细胞癌(Esophageal squamous cell carcinomas,ESCC)是最常见和最致命的癌症之一。然而,化疗和放疗仍然是治疗食管鳞癌标准的治疗方法,但生存率却很低,因为在食管鳞癌中很少有治疗靶点被发现。人类恶性肿瘤的分子整合分析可以对肿瘤样本进行分子分型,以便对肿瘤患者进行精确管理治疗,而大多数关于食管鳞癌的研究仅限于单一组学分析。因此,研究食管鳞癌多组学分子变化的整合分析对于食管鳞癌的临床治疗是非常重要和紧迫的。内容:这是第一个在食管鳞癌大样本队列中进行的多组学研究,包括全基因组、表观基因组、转录组和蛋白质组数据。我们对所有样本的综合分子特征进行刻画,并识别不同通路的激活和显著功能性的改变,这对患者进行个性化治疗是非常重要的。同时,我们在整个基因组上,观察了基因表达水平与启动子/基因主体CGI区域中的甲基化水平的关系。方法:我们对155名食管鳞癌患者的配对肿瘤和邻近正常组织进行了全基因组(WGS)、全基因组甲基化(WGBS)和转录组(RNA-seq)深度测序,并用MutSig、Oncodrivefml和dndscv软件识别显著突变基因(SMG)。同时我们对启动子/基因主体CGI区域的基因表达和甲基化的关联进行研究。结果:在这里,我们对155对食管鳞癌(ESCC)样本的全基因组、表观基因组、转录组和蛋白质组数据进行综合分析。我们识别得到17个显著突变基因,并且发现5个频率最高的显著突变基因:TP53,PIK3CA,NOTCH1,CDKN2A和ZNF750。同时我们根据多组学数据确定六个典型的信号通路,包括细胞周期、RTK-RAS-PI3K、细胞分化、增殖、NRF2和染色质重塑。在整个基因组上,我们观察到基因表达水平与启动子CGI区域中的甲基化水平呈负相关,但与基因主体CGI区域中的甲基化水平呈正相关。结论:总之,这些结果强调了基于多组学数据的分子特征对于食管鳞癌治疗的临床价值。并且食管鳞癌综合丰富的数据可作为一种宝贵的资源,进一步提高我们对该疾病的理解和临床治疗。