论文部分内容阅读
对基因调控网络的建模和算法研究在理论和实践上都具有非常重要的意义。基因调控网络是由一组基因、蛋白质、小分子以及它们之间的相互调控作用所构成的一种生化网络,是生命功能在基因表达层面上的展现。研究基因调控网络的目的是通过建立基因调控网络模型对某一个物种或组织中的全部基因的表达关系进行整体的模似分析和研究,在系统的框架下认识生命现象。随着系统生物学的发展,人们已经逐渐地认识到生命复杂系统构成的基本规律。而根据这些基本原理,科学家又可以人为地设计并构建非天然的控制生命活动的分子网络。
由于细胞内化学反应本身的随机性以及每个细胞中许多基因、核糖核酸和蛋白质的低数目等原因,基因调控网络中存在大量的随机波动,这种随机性影响所有的生命过程。近年来,大量关于基因调控网络随机性的模型和分析方法随之出现,且许多实验结果也证实了随机性的存在和影响。本文首先讨论了齐性空间下的基因调控网络的动力学模型,特别是齐性介观模型,然后我们从齐性介观模型出发引入了齐性空间下基因调控网络中的随机性以及刻画随机性的一个常用模型——主方程,并且详细介绍了分析主方程的一种逼近方法——线性噪声逼近,同时还给出了一个实际应用的例子。
目前在对齐性介观空间(homogenous mesoscopic space)中的基因调控网络模型的离散随机模拟中,已经发展出许多算法,其中Gillespie算法是应用最为广泛的一种蒙特卡罗仿真算法。在这些算法中,既有速度较慢的精确随机模拟算法(SSA)如Gillespie的直接方法(Direct Method)和第一反应方法(First Reaction Method)以及Gibson的第二反应方法(Next Reaction Method),也有快得多的加速算法如各种τ—leaping方法,这些算法有着各自的特点。然而在细胞中,由于重力、电荷力、细胞结构等各种物理因素的存在,空间并不是齐性的。对于这种非齐性介观空间(nonhomogenous mesoscopic space)中的生化反应可以通过建立反应——扩散主方程并利用随机模拟进行研究。由Johan Elf等人先后发展出了空间下一反应方法(The Spatial:Next Reaction Algorithm)和下一子空间方法(The Next Subvolume Method),它们都属于精确随机模拟算法,即精确地追踪每一个反应或扩散事件所发生的时间和空间位置,籍此来研究物质的分布状况和扩散过程对整个生化系统行为的影响。然而空间下一反应方法和下一子空间方法这两个算法实际运行起来非常慢,尤其是当系统中某些物质的数量非常大的时候尤为如此。再有两个算法依然假设所有物质在空间的存在属性是一样的,这并不能真实地反映出细胞内的空间结构对不同物质的分布与扩散的影响。为此本文在这两个算法基础上提出一种改进的下一子空间方法(The Improved Next Subvolume Method),不但可以刻画细胞的空间结构对不同物质的分布与扩散以及反应的影响,而且在满足一定条件时可以降低模拟过程中的计算量。本文最后给出了若干模拟生化反应系统的数值模拟例子,分别利用Gillespie直接方法模拟齐性空间下的系统和利用原始的下一子空间方法模拟非齐性空间下无空间结构差异的系统,以及利用原始的下一子空间方法和改进的下一子空间方法模拟非齐性空间下有结构差异的系统,也分析了新算法的内存消耗情况。