论文部分内容阅读
从海量的组学数据中识别出癌症发生发展中的核心驱动力和靶标依然是一项很具有挑战的工作。为了解决这些问题并且提高基于靶标的诊断和预后能力,本论文提出了全新的方法来识别靶标并且构建预后模型,这个方法是建立在细胞网络模块化的基础之上即关键核心模块上发生的无法修复的损毁会导致癌症的发生以及发展。本文通过综合多组学的数据,包括蛋白质相互作用组,基因转录组以及癌症基因组的数据设计了全新的多基因模块靶标识别的方法。这个方法相比其他同类的方法,无论数据内还是跨数据都具有更高的鲁棒性。而且在全部六种癌症类型中,我们发现显著的基因型与表型之间一致的改变发生在多基因模块水平上,这一点也有利的支持了我们的基本假设。并且进一步我们从这些模块中识别出关键的核心模块即显著突变富集以及表达差异改变的模块。