论文部分内容阅读
癌症是一种典型的复杂疾病,它的发病机理不能由单个的基因、蛋白以及分子通路来解释。我们也不能通过“线性叠加”式的简单推理来组合各个相关因素而对癌症形成一个完整的理解,类似于物理学中的多体问题。快速积累的大量组学数据,为癌症及复杂疾病的研究提供了越来越多的可用信息,但同时也需要我们在背后分子机制的基础上来进行整合、分析和处理,才有可能解释癌症的复杂性并确定各种相关的基因、蛋白以及分子通路的实际作用。为此,一个统一的、定量的癌症内源性网络假说被提出:生物在漫长的演化过程中形成了一个内源性的分子-细胞网络以完成发育过程以及生理功能的调控,癌症则是这个内源性网络中的一个或者一组固有的稳定状态。这个稳定状态在演化的历史过程中可能具有特定的功能,但现在对于整个生物体来说并不是有利的。癌症内源性网络中至少部分的关键因子已经在各类研究中被分别独立的发现了,这反过来也说明生物系统中存在着层次化的组织结构。这样的结构使得一个核心网络能够从目前已知的生物学知识中被构建出来,并能随着生物学知识的积累而被不断地完善。通过分析这个核心网络在状态空间中的随机非线性动力学行为,我们发现了一系列稳定状态分别对应生物体正常的生理和不正常的病理表型,包括自然涌现出来的癌症状态。癌症内源性网络的动力学模型由于其固有的随机性、非线性和高维状态空间,对传统的理论方法提出了挑战。为此我们发展了一套源于达尔文演化理论的处理随机过程的理论框架,并解决了一系列理论、计算问题。具体来说,我们提出了一种全新的随机微分方程的积分方法,A-型随机积分,并给出了它和传统的Ito积分之间存在着的一个简洁的转换关系。这种新的积分方式具有明确的物理意义和独到的优势:由随机微分方程所确定的随机过程的稳态分布满足Boltzmann-Gibbs分布,我们证明了其中的势函数(哈密顿量)是系统确定性动力学部分的全局李雅普诺夫函数,这个结论在任意噪声强度下都是成立的。这就使得稳态分布的最可几状态与系统的确定性部分的稳定不动点重合。我们又在一系列典型的动力系统,包括不动点、极限环和混沌系统中显式给出了势函数的构造。因此,我们的方法在随机性和确定性之间建立了一种对应,原来求解偏微分方程(如Fokker-Planck方程)得到稳态分布中关键位置信息(如稳态、过渡态)的问题很大程度上可以转化为求解系统确定性部分的常微分方程的不动点问题(求解代数方程)。相比随机模拟稳态分布,这极大减少了计算量,使得分析、研究数百维的随机动力学模型成为可能。因此这套方法也在生物、物理、化学、控制、经济等领域中存在着广泛的应用前景。而传统的随机积分方法比如Ito和Stratonovich积分并不具有这种优势,具体的计算和数值模拟实验都证明了这一点。由此建立的内源性网络的非线性随机动力学模型能够综合各种因素,给出了一个比当前流行的、在网络上进行简单推理来分析因果关系更为合理的、在一般情形下适用的框架。我们构建了前列腺癌和急性早幼粒细胞白血病的内源性网络模型,并发展了一整套计算工具。这些定量的网络模型通过收集独立的分子生物学和生化实验中所揭示的分子间相互作用“组装”而成,能够重现临床观测到的现象并给出新的理论预言。内源性网络理论还可以被应用到其他类型的复杂疾病中去,比如本文中所讨论的成骨细胞异常导致骨质疏松的核心调控网络模型。我们建立的这套框架可以作为探索复杂疾病新疗法的“干实验”平台,尤其在寻找抗癌药物组合这一“湿实验”面临巨大挑战的领域:我们的方法可以整合已有的生物学知识,利用计算方法找到可能的组合药物靶点,为“湿实验”指明方向。