论文部分内容阅读
基因的重复以及其后的分化一直以来就被视为新基因功能产生的主要引擎和动力源泉。什么机制驱动了重复基因获得新功能对于理解高等生物复杂性进化至关重要。般认为适应性进化是基因新功能进化的唯一机制。科学家们已经提出了两个模型即新功能化(NEO-F)模型和逃脱适应性冲突(EAC)模型来说明重复基因的适应性进化。尽管有实例研究结果分别支持这两个模型,但是在基因组水平上对这两个模型相对重要性评价的研究仍然未见报道。啤酒酵母Saccharomyces cerevisiae大约在100百万年前经历了一次全基因组重复事件,经过漫长的进化后,到今天约有10%的酵母全基因组重复基因保留在了基因组中。这些保留的重复基因经历了适应性进化吗?如果经历了适应性进化,新功能化(NEO-F)模型和逃脱适应性冲突(EAC)模型哪一个更流行?为了回答这些问题,我们利用基于系统发生的极大似然方法和来自多个酵母种的序列数据探测了重复基因适应性进化即经历正选择的证据。对223个平衡数据集的分析得到了如下结果:1.相当数量的啤酒酵母重复基因的进化经历了正选择运用在正选择探测方面使用较为普遍的枝长位点模型A与其空白模型构建似然比测验(LRT),在啤酒酵母223对经历过全基因组重复中保留下来的基因对中,发现其中有108个(48%)基因在紧接全基因组重复后的一条或两条枝上有正选择的证据,表明适应性进化是促进酵母重复基因保留的主要机制之一。将这些基因与没有正选择证据的基因进行GO分析发现这些有正选择证据的基因在抗氧化,分子转换器和生物粘连性三个方面有一定比例,而那些没有正选择证据的基因却都表现为0,表明了这三个功能组对酵母适应性进化的重要性。2.EAC模型是酵母重复基因适应性进化的主要机制之一我们严格按照两种适应性进化模型的特点以及辨别标准,创新性地仅仅运用PAML的计算结果从ω着手对EAC和NEO-F模型进行了划分。在模型B的结果中,有38个基因被鉴定为EAC模型,有87个基因被鉴定为NEO-F模型;在模型A下,EAC和NEO-F模型的数量分别为43和65。而将两种模型综合起来,先用模型B做一次筛选,再将剩下的结果用模型A进行鉴定,这样得到的结果为:EAC 5个,NEO-F 17个。这些结果表明尽管NEO-F模型比EAC模型更普遍,但EAC模型也是酵母重复基因适应性进化的主要机制之一。从以上的结果我们可以得到两点结论:第一,虽然啤酒酵母基因组在100个百万年以前经历了全基因组重复,其年代已经十分的久远,但当我们对紧接基因组重复后的进化枝运用极大似然法进行正选择位点探测时,仍然在近一半(48%)的基因中发现有适应性进化的证据。这说明适应性进化机制对于重复基因进化有着极为重要的作用。第二,虽然酵母重复基因进化符合EAC模型的比例比符合NEO-F模型的小,但由于其在基因新功能进化中的特殊地位,其重要性仍然不容忽视。