论文部分内容阅读
近年来高通量技术产生的海量数据促使系统生物学研究日益成为人们研究的热点。生物学网络作为生物系统的抽象表示,在揭示生物过程(或功能)实现机制方面起到至关重要的作用。而分析其组织方式则是了解网络结构与功能间关系最直接的方式。因此,生物学网络的功能模块性分析成为系统生物学中的核心问题之一。大量研究指出,生物学网络大都具有功能模块性。这是人们对大部分生物学网络模块划分结果进行归纳分析得到的结论。然而,深入研究发现,这些方法识别的模块与生物学功能之间的关系较为复杂,并没有明确的对应关系。因此,我们需要一种系统化度量功能模块性的评价体系,为生物学网络的功能模块性给出更准确的视图。另外,在功能模块性划分方面,识别条件特异的网络模块更能说明网络的动态性,并为功能模块性较差的网络提供新的模块划分方向。鉴于上述问题,本文首先给出了功能模块的定义方法,并基于该方法定义的功能模块提出了一套新的度量生物学网络功能模块性的指标体系和功能模块性判定准则。将该指标和判定准则应用于转录因子调控网络、蛋白质相互作用网络和代谢网络,得到了具有显著生物学意义的结果。另外,根据转录调控网络的功能模块性特点和网络动态性,我们发展了一种识别调控网络模块的方法。形成了从定义到分析,最后到划分方法的一整套研究。我们将这些主要研究工作和创新之处概括为“一个指标体系,两个生物学意义发现,三个算法或算法改进”。具体简介如下:1)借鉴软件工程的思想,提出了一套新的度量功能模块性的指标体系,并制定了功能模块性判定的标准。该指标体系包含三个指标:度量网络模块内聚性的内聚度、度量模块之间耦合性的耦合度、综合考虑内聚性和耦合性的模块性度量——模块度。与其他模块性指标相比,我们的指标更加适用于度量生物学网络的功能模块性。另外,功能模块性判定准则不仅包含了指标值的标量判定,还引入了统计检验,为判定功能模块性给出了可信程度的统计度量。2)将该指标体系和判定准则应用于酵母的转录因子调控网络和蛋白质相互作用网络中,结果表明转录因子调控网络并未展现出功能模块性,而蛋白质相互作用网络的功能模块性较强。这说明并不是所有种类的生物学网络都具有很好的功能模块性。经过对这两种网络的比较分析,我们认为生物分子的功能特异性对网络的功能模块性具有至关重要的作用。转录因子承担了大量转录调控角色,其功能特异性明显低于蛋白质相互作用网络中蛋白质的功能特异性,直接导致转录因子调控网络并没有显著的功能模块性。3)通过将功能模块性指标用于分析23种真核生物、136种细菌物种和18种古生菌的代谢网络,我们发现各物种的代谢网络都呈现出非常显著的功能模块性。更重要的,我们还分析了各物种代谢网络的功能模块度与进化距离之间的相关性:真核物种和细菌物种的代谢网络功能模块性随进化距离的增大而变强;古生菌则与之相反。这可能是因为古生菌物种大部分生活在其他物种难以生存的极端环境下,环境带来的进化压力与其他物种不同所导致的。4)功能模块定义方法对于网络功能模块性分析具有决定性的作用。针对已有算法定义功能模块时存在的问题,我们提出了直接定义功能模块的几个基本原则。在应用中,我们采用MIPS功能注释定义了酵母转录调控网络的功能模块,结果发现,网络中存在大量功能集中但拓扑结构表现为离散集合的功能模块,这说明该网络的功能模块性较差。另外,我们还将基于GO的功能模块定义方法以Cytoscape插件形式加以实现,并以可视化方法展示了酵母转录因子调控网络的功能模块性分布情况。5)在功能模块性指标计算中存在大量的求解模块间节点对最短路径的过程,计算复杂性较高。我们首先简要给出了基于网络最小路径算法的传统计算过程(称为传统方法)。由于在具体问题中采用传统算法存在大量重复计算,我们提出了一种快速计算的方法,称为DNM算法。该算法可以在一次循环处理中得到所有模块之间的众多节点对的最短路径,并保证了我们在计算功能模块性指标对最短路径的严格要求。6)由于转录因子承担了大量的转录调控功能,酵母静态转录调控网络并没有显著的功能模块性特征。因此,条件特异的动态调控模块一定程度上代表了转录调控网络的功能模块。我们利用细胞周期条件下的时序基因芯片数据对基因转录调控过程进行微分方程建模,并采用了全新的视角(将微分方程模型作为优化问题并用遗传算法求解,而非直接用微分方程求解)求解该模型。结果说明,遗传算法求解过程对于大多数靶基因是收敛的。以人工收集的细胞周期相关调控关系集为评价集,我们的算法较现有的方法表现出更高的性能。另外,我们的算法识别的条件特异调控模块相比于静态网络(即整个调控网络)更加接近真实情况:在条件特异模块中,共调控转录因子相关关系更紧密;能识别出酵母细胞周期中可能存在的调控因子复合物。综上所述,本文在定义功能模块、提出新指标体系、分析多种生物学网络的功能模块性、识别条件特异调控子网等方面取得了创新性进展,为生物学网络功能模块性分析给出了新的视图。