论文部分内容阅读
随着人类基因组计划的完成和后续生物测序项目的实施,第二代自动测序技术的成熟和广泛应用更使得这些生物学数据成几何倍数增长,如何有效整合和利用这些数据成为现代生物学研究的重要问题。代谢网络的研究是系统生物学研究的重要组成部分。本文深入研究了微生物代谢网络的相关构建方法,基于RAVEN构建了指状青霉全基因组规模的代谢网络,通过数据整合对流平衡分析方法进行了扩展,并提出了一些新的分析方法。目前常用的流平衡分析法只能分析瞬时代谢过程,不能有效地整合外部环境变量(如葡萄糖、氮源等底物浓度),本文提出了一种整合外部环境变量的动态流平衡分析法。实验结果表明该算法具有较好通用性和实用性,与静态的流平衡分析方法相比,更能直观地反映生物的生长速率变化情况与代谢反应的速率变化情况。基因发生突变会导致氨基酸位点发生变化,从而导致蛋白质活性改变,目前的代谢网络模拟分析尚未考虑到这种影响。本文将氨基酸多态性信息加入到代谢网络的模拟中,用于研究蛋白质中某一位点发生突变对该蛋白质活性的影响,同时通过将该影响加入到代谢网络中用于验证该蛋白质及其控制的反应在生物生长中的重要程度,实验结果表明,基于氨基酸多态性考虑单氨基酸变异对生物生长速率的影响的方法不仅能够研究氨基酸变异对蛋白质活性的影响程度,同时也能够通过生长速率的变化研究该蛋白质对生物生长的重要程度。在代谢网络关系中不仅需要知道参与基因的数量,同时也要考虑到基因表达量的情况。本文整合转录组数据与代谢网络预测基因,提出ITD-MEPE (Integrated transcriptional group data and metabolic network to predict gene)方法,将转录组测序数据加入到代谢网络根据代谢网络可以直观反映生物的生长状态的特点来预测与生物性状有关的基因。实验结果表明,整合转录组测序数据与代谢网络预测基因排名的准确性优于经典的基于变化率的BR算法和分析基因表达差异的DESeq方法。