论文部分内容阅读
生命起源是现代自然科学要解决的三大核心问题之一。20世纪50年代初,Miller成功模拟了原始地球环境下的氨基酸产生,引领大家揭开了现代生命起源研究的新篇章。半个多世纪以来,科学家们在生命起源方面进行了大量研究,对氨基酸、密码子等的起源初步形成了统一的认识,但是对于蛋白质起源的研究却相对进展缓慢。这是因为研究原始蛋白的结构与功能是很困难的。但是近几年来,基因组学、结构基因组学等各种“组学(-omics)”的快速发展为蛋白质结构进化历史提供了新的研究途径。这些新兴学科为我们提供了大量关于蛋白质结构与功能的信息,由此可以初步推断原始蛋白的结构与功能特征。蛋白质的某些性质(或元素),包括折叠类型(fold)、酶的催化位点、辅酶、辅因子以及部分短肽片段等,在进化过程中是非常保守的。它们可以作为“分子化石(molecular fossils)”,用来推测原始蛋白的结构与功能。但是,对于原始蛋白的结构与功能特征我们很难用实验去证实,因此,我们需要用不同的方法、标准以及不同的实验数据对其进行进一步的验证。本论文从新的蛋白数据集和新定义的分子化石——酶的催化位点出发,推测了原始蛋白的结构与功能特征。首先,通过选取酵母(yeast)蛋白质组中最古老的一组蛋白,综合运用现有的生物信息数据库SGD、SCOP、PDB等,对这一组蛋白进行结构统计分析,发现这些蛋白的折叠类型在domain和family空间中的分布服从“Power-law规律(幂率分布)”;其次,发现这一组蛋白中使用最普遍的折叠类型(folds)分别为:P-loop containing nucleoside triphosphate hydrolases(c.37)、TIM beta/alpha-barrel(c.1)、NAD(P)-binding Rossmann-fold domains(c.2)、Ferredoxin-like(d.58)、RibonucleaseH-like motif(c.55)和Flavodoxin-like(c.23),这与此前Caetano-Anollés等人的研究结论非常一致;最后,发现最原始的蛋白功能都与一些基本的代谢有关,如嘌呤代谢、嘧啶代谢以及卟啉-叶绿素代谢等。此外,我们还发现,大部分原始蛋白都需要结合ATP等辅因子来发挥正常功能。通过利用MANET数据库和文献信息,通过比较酶的起源顺序,分析了主要代谢途径的进化方式,本论文还初步检验了Horowitz假说的合理性。