论文部分内容阅读
随着基因组、转录组、蛋白质组等各种“组学”研究计划的蓬勃开展,生命科学进入了“组学”时代。代谢组学(metabolomics)作为一门对体内各种代谢途径、代谢产物进行高通量和系统分析的学科,是继基因组学、转录组学、蛋白质组学后系统生物学的另一重要研究领域。代谢组学以代谢物(基本上是化学小分子)为研究对象,代谢物的种类和浓度变化被视作生物系统对遗传变异或环境扰动的最终响应,因此代谢组比基因组和蛋白质组更接近生物表型。代谢组学作为系统生物学的重要分支,其研究的重点是细胞内代谢物种类与浓度的定性和定量分析以及代谢网络的构建和模拟。以往代谢组学的研究仅仅局限在高通量实验技术上,近年来,基于生物信息学工具对代谢组分析的方法得到了快速发展,为杀菌剂及靶标的发现提供了强有力的技术支撑。首先,我们从KEGG数据库中收集了E. coli的代谢物及代谢反应方向等数据,重构代谢网络,计算代谢物的物理化学性质。通过相关性分析,我们发现代谢物浓度与代谢网络的拓扑性质及其物理化学性质(极性、分子体积和水溶性)有较强的相关性。为此,我们分别建立了基于物理化学性质、网络连接度的代谢物浓度的线性回归预测模型和支持向量回归(SVR)模型。随后运用逐步回归的方法得到了代谢物浓度与7个描述符之间的线性回归方程;并利用递归特征消除法筛选到了1个网络拓扑参数和10个与极性、水溶性等相关的物理化学性质。通过与线性回归及网络热力学方法的对比,我们发现特征筛选后的SVR代谢物浓度模型的预测结果更准确,这个结果与我们的预期相符,即大肠杆菌的代谢物浓度主要与代谢网络连接度及代谢物的极性和水溶性有关。其次,我们把基于SVR的代谢物浓度预测模型应用于其它动、植物致病菌。基于代谢物的10个物理化学性质和代谢网络参数的共11个特征,预测出这些致病菌的代谢物浓度,并构建了代谢物浓度预测网站。该网站提供了胡萝卜软腐果胶杆菌、金黄色葡萄球菌、结核分枝杆菌等10种细菌的代谢物浓度查询服务,同时也可用于其它细菌的代谢物浓度预测。另外,我们提出了利用代谢物浓度在杀菌剂发现中的一个新规则:靶标底物浓度小于0.5mM,且竞争性抑制剂水溶解度应该超过底物浓度的100倍。利用此规则,我们很好地解释了前人一些有趣的研究现象。最后,我们借助代谢物浓度发现了3个有研发潜力的黄酮类杀菌剂靶标。同时我们发现位于黄酮化合物小分子上的吡喃环3位上的没食子酸或者糖苷集团对FrdA、PyrD、FabI的结合有比较大的影响。对3种靶标蛋白的生物功能的分析显示与已经报道的黄酮杀菌剂的杀菌机制相一致。结合代谢物浓度判别规则,发现12种黄酮化合物的水溶解度与代谢物底物浓度相比普遍都具有较高的水溶解度。因此,这3个靶标是非常有潜力的杀菌剂靶标。本文利用支持向量回归的方法结合代谢网络建立了细菌代谢物浓度预测模型,为从代谢水平研究药物靶标提供了新的思路和判别规则,并成功地应用在黄酮类杀菌剂靶标的筛选上。