论文部分内容阅读
细胞生命活动是一个十分复杂的过程,受蛋白质和基因表达相互作用等生化反应的调控,其生化反应表现出明显的随机性。而对生化反应系统进行建模和仿真的一个重要途径是研究系统生物学,这一过程中,离散性和随机性起着很重要的作用。本文中我们主要讨论了马尔可夫与非马尔可夫过程中生化反应的随机模拟算法问题。在马尔可夫过程中,在介绍随机过程理论的基础上,从生化反应系统的基本假设出发,介绍关于生化反应内部噪声、外部随机扰动和包含时间滞后的反应过程的各种数学描述,包括化学主方程、化学速率方程、化学郎之万方程以及相关的数值模拟方法,包括随机模拟算法(SSA)和τ-跳跃算法。随机模拟算法(SSA)作为对生化反应系统的“准确”模拟方法已经广泛应用于各种研究中,特别是生物学领域。但是由于生物系统的复杂性,在很多问题上,巨大的运算量使得随机模拟算法(SSA)的模拟速度非常缓慢,这促使人们迫切寻求更高效快速的模拟方法,于是便有了 τ-跳跃算法,使得模拟速度和精度大大提高。在生化反应中,化学主方程作为描述生化反应最基础的方程,虽然能对很多过程做统计描述。但如果系统较大,维数较高,要准确求解化学主方程非常困难。所以在不同的条件下可以推导出化学主方程的各种近似方程,比如化学速率方程、化学郎之万方程等。当随机涨落可以忽略时,化学速率方程可以很好地描述系统的动力学行为,当随机涨落较大时,在一定条件下化学郎之万方程可以对系统的随机行为给出合理的刻画,因此在对给定的生化反应系统进行建模时研究如何选择合适的方程描述系统的动力学具有十分重要的意义。时滞是生化反应系统中普遍存在的现象,解释了许多随机过程的非马尔可夫性质,这些随机过程在涉及生化反应或转运的分子生物学的大量问题中起着关键作用。本文引入了一个精确的和通用的框架,它可以正确实现非马尔可夫离散随机过程系统的统计。在大量进程的限制下,本文提供了一个近似且简单的模拟算法,其工作原理与最初的Gillespie方法完全相同,不同之处在于事件的瞬时速率取决于事件上次发生后经过的时间。为了更精确地模拟其反应过程,在模拟过程中需要体现分子之间的差异,当系统中反应物分子数目较大时,我们可以忽略个别分子的差异,但是当系统的规模较大或者时滞时间较长时,等待序列的规模也会变得相当庞大,从而对它们的读取与处理将会花费大量的时间。本文提出nMGA算法,在非马尔可夫随机算法的基础上,比较nMGA与改进的Anderson算法的性能会发现,尽管nMGA只是近似的,但在本文中我们的数值模拟表明,即使对于少量的过程,该算法也能够非常精确地再现事件间隔时间,对于αi>1的过程,偏差很小。基于该方法提出的模拟算法能够有效地提高模拟速度和精确度,并且应用到生物系统中去。