论文部分内容阅读
本论文包含两方面内容,分别从两个不同层次来探讨基因型-表型映射问题。其一是利用统计学模型在大尺度上探讨基因多效性的估计问题。基因多效性是指一个基因影响多个表型性状的能力。由于受一个基因影响的表型性状数目往往很难直接计算,我们通过蛋白质序列数据来间接估计基因多效性。其二是利用动力学模型在微观水平上探讨基因型-表型某一特定映射的非线性动力学问题,通过构建数学框架来探讨胞吐过程中膜融合的调控机制,从而理解基础的生化通路是如何决定上层细胞的行为的。工作的长期目标是发展一种综合的数学框架,以便更好地理解生物系统的复杂性。 首先是基因多效性的估计问题。基因多效性是基因型-表型传递过程中非常重要的一个环节,这方面的研究对了解基因型-表型映射有着重要意义。基因多效性在遗传、发育和进化中扮演着重要的角色。虽然最近几年模式生物的功能基因组学等研究带来了大量与基因多效性的特性和程度有关的高通量数据,但在基因多效性的特性和程度的具体研究上仍然存在着诸多争议。Gu开发了一种统计方法,基于蛋白质序列的多序列比对来估计一个基因的“有效多效性”。这一新的研究方法试图利用遗传数据来估计基因多效性,而不用计算受基因突变影响的表型数目。尽管对这一问题有着广泛的讨论,但对用此方法估计得到的基因多效性的生物学解释仍然不是很清楚。为了解决这个问题,本文首先构建了最小基因多效性理论。最小基因多效性与基因型-适合度映射的秩(Ke)有关,也就是从基因型到适合度(分子表型)的不同映射线;其次,本文证明了Gu的方法实际上估计的是基因型-表型映射的秩,在一定条件下也可以作为基因多效性程度的一个有效估计,同时,实验数据和计算机仿真都证实了这个理论预测的准确性。进一步地,本文发展了一种新的方法来修正原始工作中的估计误差。 另一方面,本文提出了一个计算框架来探讨胞吐过程中膜融合的调控机制。在系统生物学水平进行具有生物学意义的动力学研究的一个难点在于生物体内系统调控的复杂性。同时,由于很多动力学速率未知的原因,使得我们在实际进行全局的系统研究中碰到了很多的困难。在本文中,我们以胞吐过程为例,开发了一个计算流程来帮助解决这个问题。胞吐是所有真核细胞里一个必不可少的过程,它的作用是利用囊泡将胞内物质排出细胞外。在这一过程中,一类被称为SNAREs的蛋白质起到了引擎的作用。它们通过在靶标(细胞膜)-特异性SNAREs和囊泡特异性SNAREs之间形成四螺旋束复合体来促进囊泡和细胞膜的融合。胞吐的调控网络非常复杂,基于目前对胞吐相关的蛋白质-蛋白质相互作用网络的了解,我们利用常微分方程(ODE)构建了胞吐作用的整个系统。然后基于与常规体内实验吻合得很好的有限的体外实验数据,应用数学方法(逆问题)估算基本亚系统(不考虑调控)内的动力学参数。这些估计使得我们可以在指定的参数空间下对有调控和无调控的胞吐过程进行有效的稳定性分析。最后,我们觉得这一方法在解释实验观察值并基于这些观察值形成可以检验的假说并用于进一步的实验方面具有一定的潜在应用价值。