论文部分内容阅读
系统生物学研究的目标是构建数学模型对生物体生理代谢过程进行定量模拟和预测,系统研究细胞组分互作机制,揭示生物体运作内在规律。组学研究积累了海量数据,数据挖掘技术及日趋成熟的模型构建理论使得利用组学数据构建基因组规模代谢和调控模型成为可能。丙酮丁醇梭菌Clostridium acetobutylicum ATCC 824是重要的ABE(丙酮,丁醇,乙醇)工业生产菌株,其生理代谢的复杂性一定程度上阻碍了进行有效的代谢工程改造。为系统认识其代谢调控分子机制并为代谢工程改造提供策略指导,需要利用系统生物学干法构建C.acetobutylicum ATCC 824的计算机模型。 首先,利用基因组注释和生化数据库信息构建了C.acetobutylicum ATCC 824的基因组规模代谢模型iYZ766,囊括777个化合物,1003个反应和766个基因,为目前最全面的梭菌基因组规模代谢模型。利用iYZ766预测不同碳源上的生长情况和葡萄糖培养基上的发酵过程,结果显示模型能够准确预测生长表型。由于C.acetobutylicum ATCC 824可能在主要碳流途径上存在复杂代谢调控机制,随后利用酶动力学信息和发酵数据构建了中心代谢途径的动力学模型kYZ18,并将kYZ18作为动力学模块引入iYZ766,构建了集成模型hYZ766。采用数值逼近原理模拟不同初糖浓度,不同胞外pH值下的生长代谢过程,经与发酵数据比较发现hYZ766能够较准确预测代谢生长表型的动态变化。hYZ766是梭菌第一个基因组规模的集成代谢模型,不仅能计算稳态代谢通量分布,还能计算细胞生长过程中全局代谢通量分布的动态变化,以及包括biomass浓度,胞外pH值,胞外代谢物浓度积累等114个状态变量的动态变化,这为研究C.acetobutylicum ATCC 824代谢机制提供了全局动态视角,为研究具有复杂代谢调控机制的微生物提供了方法学参考,更为代谢工程改造策略设计提供了先进的虚拟平台。 其次,利用已发表的C.acetobutylicum ATCC 824 microarray数据及互信息熵算法构建了梭菌首个基因组规模的基因共表达网络,其中功能可能密切相关的基因被聚类成组,这为注释未知功能基因提供了参考。运用反向工程算法,并结合启动子预测,(0)A box预测,同源注释等信息,构建了C.acetobutylicum ATCC 824的首个产孢调控网络spoYZ31。进一步将其转化为布尔动力学模型,并对细胞生长进行了随机动态模拟。发现98.54%的初态最后停留在一个点吸引子上,对应着一系列生长相关σ因子编码基因以及控制生长和转变期基因表达关键转录调控基因abrB的持续表达。单一主吸引子的结构说明细胞生长可能具有较强的鲁棒性。构建产孢基因调控模型对认识梭菌细胞分化的内在调控机制和动力学特征,以及理解梭菌细胞生理和代谢的相互作用具有重要意义,也为最终构建C.acetobutylicum ATCC 824的全细胞模型提供了重要的调控模块。 最后,为解决通量平衡分析(Flux Balance Analysis,FBA)算法的等效解问题,进一步提高代谢通量分布预测的准确度,发展了基于热力学原理的热力学最优解搜索(Thermodynamic Optimum Searching,TOS)算法。该算法综合应用最大熵产生原理,Energy loop law,最小能量幅度原理和热力学第二定律,从FBA等效解中筛选热力学最优解。利用已发表的基因组规模代谢模型iAF1260和TOS算法计算E.coli在不同内外源扰动下的代谢通量分布,并以13C-标记通量组学实验数据作为参考,发现预测准确度相比FBA算法提高了10.7%-48.5%。TOS算法不仅能更准确地计算稳态代谢通量分布,也能计算稳态反应吉布斯自由能分布,这为从热力学角度研究代谢网络提供算法支持,也为设计生产目标代谢产物的热力学驱动力提供了理论依据。