论文部分内容阅读
F-box蛋白通过介导蛋白泛素化参与蛋白质的翻译后修饰。在植物中,F-box基因通过快速扩张而形成了超基因家族,并且参与了许多重要的生长发育过程。为了比较近缘物种在遗传基础上的异同,我们对拟南芥(Arabidopsis thaliana)及其近缘种琴叶拟南芥(A.lyrata)中的F-box基因进行了基因组范围内的比较进化研究,主要研究结果如下:
1、F-box基因在拟南芥和琴叶拟南芥中的数目。我们在拟南芥中和琴叶拟南芥中分别得到了686和882个有完整结构的F-box蛋白,分别占各自蛋白组的2.5%和2.7%。此外,还分别在两基因组中鉴定出54个和129个假基因。通过对两物种中F-box蛋白结构域的分析,发现它们具有多样的C-末端结构,并且含有相同结构域的基因的数目也不尽相同。
2、F-box基因的拷贝数目变化。在系统发育关系的基础上,我们将F-box基因分为46个基因家族,不同基因家族中的基因数目存在较大差别。结合共线性分析和进化速率分析,我们将两物种中所有F-box基因归为5个直系同源组(分别为1:1、1:0、2:2、X:1和X:0)。在所有同源基因对中,有420对为单拷贝直系同源关系(1:1型),分别占到了拟南芥和琴叶拟南芥中F-box基因总数的61.2%和47.6%。随后我们推断在拟南芥和琴叶拟南芥的最近共同祖先中共有943个F-box基因,而两物种在进化过程中分别经历了频繁的基因获得和/或丢失事件,使得F-box基因超家族在近缘种中表现出快速的“生与死”的进化模式。
3、F-box新基因的产生与分化。拟南芥和琴叶拟南芥在分化之后共产生了170个新的F-box基因,这些新基因主要通过串联重复和散在重复产生。通过比较最新产生的125对旁系基因,大约90%(113对)的基因对在编码区都发生了不同程度的分化;且在分化的基因对中,三分之二(86对)的基因所编码蛋白质结构域和特性发生了分化,这些结果意味着新产生的基因在编码区的分化十分快速而普遍。进一步研究表明,外显子区域内的插入/缺失是编码区分化的主要形式,而外显子化/假外显子化和外显子/内含子的插入/缺失也在编码区分化的过程中起了重要的作用。
4、直系同源基因的保守性与分化。拟南芥和琴叶拟南芥中绝大部分单拷贝的直系同源在染色体上都维持了很好的共线性关系。进化速率和选择压力的分析表明,这些基因在进化上大都受到净化选择作用,但也有部分基因受到松弛的选择压力或中性选择。对基因结构的比较发现,有近90%的基因对(375对)在编码区发生了变化,而且其中一部分基因所编码的蛋白质在结构域和特性上发生了改变。上述结果说明,单拷贝直系同源基因在近缘种间也不一定是完全保守的,会发生基因结构甚至功能的分化。另外,直系同源基因之间的保守性在不同家族中存在差异。
综合以上结果,F-box基因在拟南芥和琴叶拟南芥两个近缘种间的拷贝数目有较大差异,在进化过程中表现出快速的“生与死”进化模式;新产生的旁系同源基因间以及单拷贝直系同源基因间均有较高比例的基因结构分化;不同基因家族的F-box基因在进化式样上也有差异。上述基因家族比较的结果反映出两物种的基因构成已经产生了显著的变化。本研究从进化的角度丰富了人们对植物F-box基因超家族的认识,对F-box基因分子功能的研究具有借鉴意义,也为了解近缘种在基因构成上的异同提供了一个良好的范例。