论文部分内容阅读
癌症是一种遗传异质性疾病,涉及多种生物学功能通路内基因的遗传变异。相同癌组织样本中不同的细胞发生遗传改变的基因也各不相同。因此,识别候选癌基因便成为一项富有挑战性且具重要意义的工作。本文提出通过寻找在癌样本中突变显著共发生的基因,筛选候选癌基因,并进一步分析共突变基因在癌症发生过程中的协同关系。其主要工作如下:1、通过分层控制FDR(stratified false discovery rate)寻找显著发生共突变的基因:基于肺癌和人类蛋白激酶两套高通量基因突变数据,我们分别研究了传统控制FDR的方法和删除低频率突变基因控制FDR的方法对于发现共突变基因对的影响。结果显示,传统控制FDR的方法,对于检验次数过于庞大的数据控制过于严格,会大量损失真阳性共突变基因对,而删除低频率突变基因的方法,可能提高发现共突变基因对的效能。但是,很多低突变频率的真阳性基因的结果仍然不能被发现。为提高寻找共突变基因对的效能,我们提出使用分层控制FDR寻找共突变基因,结果证明该方法不仅具有较高的效能,而且该方法可以为发现候选癌基因提供无偏的统计学证据。2、探究基因共突变在癌症中的协同关系。基于肺腺癌突变数据发现的109对显著共突变基因对涉及了83个基因,基于人类蛋白激酶突变数据发现的200对显著共突变基因对涉及了91个基因。分析两套数据的共突变基因对发现(1)发生共突变的基因富集已知癌基因;(2)基因的共突变倾向于发生于不同通路之间。以上结果提示,在癌样本中显著共发生突变的基因倾向于候选癌基因;在癌发生过程中起重要作用的基因倾向于协同扰动不同的癌相关细胞生物学过程。此外,文章还基于共进化的基因功能模块。从在癌样本中突变的基因中筛选出与已知癌基因位于同一共进化网络模块的基因,预测为候选癌基因。由此,我们得到15个候选癌基因。已有工作支持这些候选癌基因的异常改变在癌症发生过程中发挥重要作用。