基于TCGA数据库的泛癌症DNA甲基化模式及TP53突变相关表观和转录整合分析

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ppl_fox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症是一种由细胞增殖异常引起的复杂疾病,具有细胞分化异常、持续存在的生长增殖信号、抵御细胞凋亡、转移和浸润的激活等生物学特征。由于癌症的复杂性、样本间甚至样本内异质性,其发生、发展机制目前仍不清晰。在癌症的发生、发展过程中往往伴随着驱动基因突变以及甲基化水平的变化等一些基因组不稳定性和表观遗传的改变导致正常细胞功能发生变化。因此,揭示癌症中基因组和表观遗传修饰对转录的调控,对于我们理解癌症的发生、发展的至关重要,为癌症的精准医疗提供理论依据。本研究旨在构建泛癌症中驱动基因突变、DNA甲基化以及其与基因表达之间的调控关系,揭示驱动基因突变和其相关的表观调控紊乱在癌症进程的潜在作用机制。基于TCGA数据库中常见的8种癌症类型的DNA甲基化芯片、全外显子测序以及转录组测序数据,通过对DNA甲基化数据进行层次聚类,对癌症进行亚分型并将亚分型结果与样本的临床表型以及分子特征进行关联分析。筛选出了与全局DNA甲基化水平相关的驱动基因突变,重点鉴定了TP53突变相关的差异DNA甲基化位点与差异表达基因,构建了TP53突变相关的DNA甲基化水平改变-基因差异表达的调控关系,具体研究结果如下:1、本研究对DNA甲基化芯片数据进行了层次聚类,将每种癌症样本分为2-4个亚分型,并分析了每种癌症各个亚分型中临床分期、生存率、肿瘤突变负荷、免疫浸润水平的差异。生存分析结果显示LUAD与UCEC的亚分型间样本的预后情况存在显著差异,卡方检验结果显示BRCA、COAD、KIRC和THCA中的亚分型结果与临床分期具有显著相关性,COAD、LUAD、UCEC中各个亚型间的肿瘤突变负荷以及免疫浸润水平均有显著差异,这些结果揭示了同种癌症样本间DNA甲基化水平的异质性,以及这些异质性可能与患者临床分期和分子特征相关;之后我们使用Mut Sig算法筛选出各个癌症中的驱动基因,并与亚分型结果进行整合分析,结果显示部分驱动基因在癌症不同亚型间的突变频率存在显著差异,例如THCA的驱动基因BRAF,它在THCA亚型2中的突变频率高达82.5%(240个样本中有198个携带BRAF突变),而在THCA亚型1中的突变频率仅有7.35%(10/136),这些结果表明驱动基因的突变可能与癌症全局DNA甲基化水平相关。因为TP53突变频率在5种癌症的亚分型中均有显著差异,说明其突变与DNA甲基化水平相关,因此我们选择TP53进行后续研究。2、我们将癌症样本依据是否携带TP53突变分为突变组以及非突变组,对DNA甲基化和基因表达进行了差异分析,得到了与TP53突变相关的差异DNA甲基化位点以及差异表达基因。我们筛选得到cg11804789、cg24205914和cg26383138等位点以及DCAF4L2、PAGE1、MAGEC2、WIF1、SPATA18和PNMA5等基因在多种癌症突变组和非突变组中均存在差异且趋势一致。KEGG通路富集分析显示TP53突变相关的差异表达基因主要富集于细胞周期、DNA复制、神经受体-配体相互作用等通路。在筛选得到的差异表达基因中,有部分基因是已经被实验证实的受TP53调控的靶基因,例如乳腺癌中的PTCHD4以及肺腺癌中的PGC,同时部分差异表达基因与TP53的表达存在显著相关性,例如HNSC中的ARHGAP26以及LIHC中的DCDC2,它们可能是TP53潜在的靶基因。最终我们通过生存分析筛选得到一些潜在的肿瘤预后标志物,例如位点cg08698854和基因ZNF541。3、将与TP53突变相关的差异DNA甲基化位点与差异表达基因进行整合分析,最终构建了各个癌症中TP53突变相关的DNA甲基化水平改变-基因差异表达的调控关系。并且从中筛选出一些关键的探针-基因调控对,例如在LIHC中KRT17基因在TP53突变组上调表达,可能与KRT17启动子区域的探针cg19003337去甲基化相关。生存分析结果显示探针cg19003337的去甲基化与基因KRT17的上调表达均与LIHC样本的不良预后显著相关,进一步证实TP53突变相关的cg19003337去甲基化-KRT17上调表达调控关系在肝癌的发展进程中发挥重要的作用。总结:本研究发现同种癌症不同样本间仍存在较强异质性,且异质性可能与驱动基因突变情况相关。我们重点鉴定了与TP53突变相关的差异DNA甲基化位点和差异表达基因,并建立了它们之间的调控关系,揭示了驱动突变与癌症进程的潜在关联。对我们进一步理解癌症发生、发展的分子机制提供帮助;同时筛选出潜在的肿瘤预后标志物,为肿瘤诊断、预后提供候选标志物。
其他文献
绝对值是中学数学重要内容之一,它可以与不等式、方程及函数融合来增加问题的难度,关于解带有绝对值相关问题的方法常用的有三种,分别是零点分段法、绝对值的几何意义和画图
聚醚醚酮(PEEK)虽然具有与骨组织匹配的弹性模量、稳定的化学性质、良好的生物相容性、热稳定性和射线可透过性等诸多优点,但PEEK是生物惰性材料,植入人体后骨整合能力差;另
土石坝沥青混凝土心墙有几个优点:万一因地震或不均匀沉陷使心墙产生裂缝时,心墙将会自愈,这是因为沥青的粘弹性-塑性特性和坝内影响材料的各种内部应力的共同作用所致。在坝
对外汉语初级阶段是指汉语零基础或只掌握了基本汉语知识的学习阶段。这一阶段的学生接触汉语时间短,掌握的语音、词汇、语法知识有限,学习具有特殊性。课堂提问在对外汉语教
文章首先介绍了数据挖掘技术、云计算及"云图书馆"的相关理论,其次分析了数据挖掘技术在图书馆中的应用现状,最后对"云图书馆"利用数据挖掘技术有效提高图书资源的利用率进行
在传统经济变量代表性减弱背景下,创新性地选取资产价格指数表征货币政策操作,基于大量基础经济指标构造经济活动因子与价格水平因子,并在TVP-SVAR模型框架下实证考察中美两
多输入多输出(Multiple Input Multiple Output,MIMO)技术已在第四代和第五代移动通信中广泛应用[1]。由于雷达和通信系统的相似性,Bliss和Forsythe等人将MIMO技术引入雷达领域,提出MIMO雷达的概念。随着战场环境日益复杂,隐身战机技术和干扰作战技术日益成熟,因此抗隐身和抗干扰成为衡量雷达性能的关键指标。相比于相控阵雷达,MIMO雷达具有更高的目标探测精
目的建立海鲜产品中铅和镉的等离子体发射光谱测定方法。方法采用硝酸—过氧化氢进行微波消解,利用等离子体发射光谱法测定海鲜中的铅和镉含量。结果该方法线性良好,铅和镉的
有些毒草混在饲草里,如不注意,被家兔误食会造成中毒死亡。常见的毒草有:车前、牵牛子、大麦黑穗菌、小麦黑穗菌、断肠草、唐松草(马尾连)、土疮痒痒、大碗花蔓、毛莨(山辣椒
在当前的经济转型期,经济发展速度较快,区域间经济发展不平衡的问题也日益严重。由于经济发展的不平衡,导致社会矛盾在一定程度上显现出来,犯罪问题也在一定程度上更为明显,