论文部分内容阅读
稻属主要包括2个栽培种和22个野生种,分属于A、B、C、E、F、G、BC、CD、HJ和HK10种基因组类型,是水稻品质改良的宝贵遗传资源,也是开展进化生物学研究的重要模式体系。尽管迄今针对稻属物种的群体遗传学已开展了不少研究,但涉及的物种范围还不够,不同研究实验数据的可比性也不强,因此稻属物种的群体遗传学研究还有待进一步深入和整合。另一方面,作为进化生物学研究的模式体系,稻属的进化历史、物种有效群体大小(Ne)和分化时间等群体参数还所知甚少,有待进一步的研究。此外,稻属基因组大小存在很大差异而且系统发育关系清楚,是探讨基因组大小变异机制的理想体系。本研究通过选取来自覆盖稻属6种二倍体基因组类型的10个野生种为对象,对上述问题进行了探讨,主要研究结果如下。
1.通过对稻属10个物种20-26个单拷贝核基因部分片段的测序及群体遗传学分析,发现稻属物种核苷酸多态性水平(πs值)介于0.0011与0.0073之间,10个物种之间存在较大的差异,最大差异约为6.5倍,在45个种间成对比较中,有23个物种对达到差异显著(P<0.05)。与其它栽培作物及其近缘野生种相比,稻属物种的遗传多样性水平普遍较低,可能和稻属进化历史中群体缩减事件频繁发生有关,而取样代表性、选择作用和交配系统等因素并不能完全解释多态性差异的原因。各物种的连锁不平衡(LD)水平同样表现出明显的种间差异(从几百bp到整个基因组水平不等),这种差异的原因仍然需要扩大群体取样范围进一步探讨。另外,各种中性检验和重组事件检测的结果可以为进一步利用这套数据研究其它进化生物学问题提供重要参考信息。
2.从核苷酸多态性数据换算得到稻属现有物种的有效群体大小(Ne)从8万到52万个体不等,存在较大的种间差异。根据本研究和以往发表的结果整理出两套数据(68位点个体数据和18位点群体数据),选用3-speciesML、MCMCcoal和IM三种方法对稻属祖先有效群体大小和分化时间进行了估计。结果表明,对于基因组类型物种尺度以上的节点,3-speciesML方法相对可靠,而对于更小物种尺度的节点,IM方法相对可靠。MCMCcoal结果中一些节点的群体大小参数后验分布强烈依赖于先验分布,涉及快速物种分化的节点尤为如此,而基于群体数据的MCMCcoal结果比个体数据对先验参数更为敏感。根据本研究估算,稻属于1100万年前开始分化,A、B和C三个基因组于400万年前开始分化,两次快速物种分化产生了现有的各种二倍体类型,而后A和C基因组分别再次经历快速成种事件形成现有的各个物种,发生时间分别在21-46万年和32-52万年前。除了O.nivara和O.rufipogon从共同祖先分化出来的过程中发生了群体扩张以外,其它物种分化过程都一直伴随着群体缩减事件,可能是由于稻属物种频繁发生长距离扩散和地理隔离所导致。
3.生物界不同物种的基因组大小差别可以达到5-6个数量级,其进化机制一直存在争议。本研究利用稻属二倍体物种基因组大小可相差4倍这一特点,验证了Lynchand Conery(2003)的著名假说“物种基因组大小与其有效群体大小成反比”。结果表明,稻属二倍体物种的有效群体大小(最大差异约6.5倍)与基因组大小之间不存在相关性。在进行基因组大小祖先状态重建并考虑系统发育关系独立性的基础上,进一步的相关性分析(包括去除非中性数据)仍然得到同样的结果,因此Lynchand Conery(2003)假说并不能解释稻属物种基因组大小变异的原因。另外,稻属基因组大小变异也不能从交配系统或其它几种学说(有利学说和中性学说等)得到解释。对明显影响基因组大小的LTR-反转座子基因家族的研究,以及准确估计更多进化因素是将来进一步探讨基因组变异机制的主要方向。