论文部分内容阅读
蛋白质相互作用在许多细胞过程中扮演着重要的角色,而蛋白质相互作用网络研究则可以从系统层次来理解细胞的活动。探索蛋白质的网络拓扑属性与其生物学功能属性之间的关系是系统生物学重要的问题之一。研究发现蛋白质在蛋白质相互作用网络中的度越高,那么它进化地越慢。研究还发现蛋白质的度越高,那么它对细胞的存活也越重要。探讨蛋白质如何组织起来实现其细胞功能是系统生物学富有挑战性的问题之一。研究发现蛋白质在细胞内是动态模块化组织起来的,这一发现有利于更好地理解蛋白质相互作用的动态特征。然而,这些研究结论却引起了极大的争论。本文通过集成基因表达数据和蛋白质相互作用数据,主要来探讨了酿酒酵母蛋白质进化、功能重要性和动态模块化组织这三方面的问题。首先,本文通过集成基因表达数据和蛋白质相互作用网络数据,提出了一个蛋白质的共表达度,它反映了一个蛋白质能够稳定地发生相互作用的对象数目。本文发现蛋白质的共表达度比蛋白质的度能更好地预测蛋白质的进化速率,并且此预测独立于其他基因组变量。对结构相互作用网络中的中心节点的分析进一步支持了蛋白质的共表达度比蛋白质的不同绑定界面数目也能更好地预测蛋白质的进化速率,并进一步澄清了共表达的多界面中心节点比其他类别的中心节点进化地都慢。本文展示了蛋白质的共表达度可以帮助更好地理解蛋白质相互作用是怎样影响蛋白质的进化速率的。从而,本文至少部分地解决了关于蛋白质的度与蛋白质的进化速率之间的关系的长时间争论。其次,本文通过集成基因表达数据和蛋白质复合物数据,提出了一个复合物共表达密度度量,这一度量定义为在一个蛋白质复合物中所有可能发生相互作用的蛋白质对显著共表达的百分比。本文展示了复合物共表达密度度量能帮助更好地说明蛋白质复合物与共表达之间的关系。本文进一步发现共表达的稳定的功能模块化不仅是约束蛋白质复合物中的蛋白质进化地较慢的一个重要因素,而且也是约束蛋白质复合物中的蛋白质对以更相似的速率进化的一个重要因素;而不共表达的瞬态的功能模块化则不具有这种特性。从而,本文说明了蛋白质复合物是借助共表达这一属性而不只是模块化这一属性来约束其蛋白质成员进化的。再次,本文通过集成基因表达数据、功能模块数据和蛋白质相互作用网络数据,把蛋白质相互作用网络中的中心节点分为四类:不共表达不共聚类的中心节点、不共表达共聚类的中心节点、共表达不共聚类的中心节点和共表达共聚类的中心节点。这四类中心节点不仅具有不同的网络拓扑属性和生物学功能一致性,而且还具有不同的功能重要性。本文进一步发现大多数中心节点之所以更重要是由于它们作为功能模块或蛋白质复合物的核心成员这一局部角色,而不是由于它们扮演着组织整个网络结构这一全局角色。从而,本文把中心节点分为四类来理解基因重要性能够帮助更好地解决关于蛋白质的度与基因重要性之间的关系的长时间争论。最后,本文通过集成基因表达数据、蛋白质复合物数据和蛋白质相互作用网络数据,把蛋白质相互作用网络中的中心节点分为四类:不共表达不共复合物的中心节点、不共表达共复合物的中心节点、共表达不共复合物的中心节点和共表达共复合物的中心节点。从不同方面来分析,这四类中心节点在组织整个网络结构中扮演着不同的角色。而且,这四类中心节点还具有不同的生物学功能一致性。这些结果支持了蛋白质相互作用网络的动态模块化组织模式。此分类方法的合理性从对结构相互作用网络中的中心节点的分析进一步得到了验证。本文也说明了此分类方法和上一段中的中心节点分类方法既有很好的对应性又有很好的互补性。本文展示了此分类方法能够帮助更好地理解蛋白质相互作用网络的动态模块化组织模式。从而,本文至少部分地解决了关于date中心节点和party中心节点是否真正存在于酿酒酵母蛋白质相互作用网络中的长时间争论。总结起来,本文的研究结果表明了通过基因表达数据和蛋白质相互作用数据的集成可以帮助更好地挖掘出蛋白质相互作用网络的拓扑结构中所隐含的生物学属性,和帮助更好地从系统层次来理解细胞是怎样活动的。