论文部分内容阅读
DNA甲基化是一种很重要的表观遗传修饰事件,是指在不改变基因组DNA序列的前提下,将甲基基团可逆地添加到DNA的胞嘧啶上。DNA甲基化的状态与癌症密切相关,异常的甲基化能够在早期癌症中被检测到。因此,DNA的甲基化状态可以用来作为癌症诊断和预后的标志物。基因甲基化的共现和互斥是指两个或者多个基因在不同样本中的甲基化水平倾向于呈现正相关或者负相关的现象。泛癌中不同基因之间突变的共现和互斥已经得到了较多的研究,然而基因甲基化的共现与互斥则少有研究。在本论文中,我们首先鉴定了一系列泛癌诊断和预后的潜在标志物,同时也构建了泛癌诊断和预后的模型。由7个潜在标志物构建的泛癌诊断模型,能够很好的预测样本是肿瘤样本的概率。7个潜在的泛癌诊断标志物与细胞分裂、DNA复制和细胞周期有关。当基于CpG位点的诊断模型训练时所使用的CpG数量超过2个时,模型的平均曲线下面积(AUC)能达到0.95以上。由12个CpG位点构建的肿瘤特异性分类器不仅可以将不同种类的癌症样本区分开,还可以预测那些已经发生了转移和未知原发位置肿瘤的肿瘤类型。在多种癌症中基于CpG位点建立的预后模型也能够预测病人的生存情况,将样本划分成高风险和低风险组。然后,我们系统地探究了多种癌症中基因甲基化的共现与互斥事件。我们用甲基化共现和互斥网络在不同癌症中都鉴定到了很多特异的表观遗传功能模块,其中,由锌指家族基因所构成的表观遗传功能模块在多种癌症中都被鉴定到了,它们大多都由于发生了甲基化而沉默。此外,频繁发生的基因甲基化共现和互斥事件也可以用来将6种癌症甚至是泛癌划分成不同的亚型,且不同亚型之间有着显著不同的预后。最后,我们在前面两项工作的基础上开发了一个数据库DNMIVD,用户不仅可以在该数据库中建立癌症诊断和预后的模型,还可以从不同角度搜索CpG位点和基因甲基化的相关信息并对其进行可视化,或者下载相关资源。总之,我们的工作能够对泛癌的诊断和预后提供一定的便利,也对癌症中DNA甲基化的研究提供了很多宝贵的信息。