论文部分内容阅读
基于标志基因的系统发生学研究极大地加快了人们对微生物多样性的认识。然而病毒没有核糖体基因,并且聚合酶、衣壳蛋白等标志基因的序列保守性差、甚至难以确定。这些不同寻常的情况加之其他因素,使得病毒的系统发生学研究还不成熟。最近,利用全基因组数据构建物种亲缘关系受到研究者广泛关注,但传统的序列联配方法不能直接应用于全基因组。如何比较基因组已成为系统发生学研究中的亟待解决的问题。
本文提出一个用以推断生物系统发生关系的新方法一碱基关联矩阵法。它是一种基于全基因组序列的、非联配序列比较方法。这种方法避开了序列联配在全基因组应用中的困难和基因选择给进化研究带来的不确定性。它利用DNA序列的碱基关联信息,具有参数少、序列长度适用范围广等特点。碱基关联矩阵法的关键步骤在于偏信息关联筛选:使自然选择压力带来的进化偏好性得以突出。本文详细讨论了碱基关联矩阵法在物种系统发生学研究中的应用,并将所得结果与其他亲缘关系研究进行比较。
根据哺乳动物线粒体基因组偏信息关联物种特异水平的分析结果,构建碱基关联矩阵用于推断哺乳动物亲缘关系。在所得到的进化树中,灵长类、啮齿类、猛踢禽兽类、单孔动物、有袋动物各自形成单源支,而且细节分支均与广泛认知的、权威进化树一致。以单孔目和有袋目为外组群,碱基关联矩阵法构建的系统发生树为(猛踢禽兽目,(啮齿目,灵长目))进化关系和啮齿类动物的非单源进化支假说提供新的支持。
对于dsDNA病毒,本文用FA(k)A、FA(k)、FA(k)C、FA(k)G、FT(k)A、FC(k)A、FG(k)A和Dk+2分别对13个病毒科和疱疹病毒科构建了进化树。得到以下结果:1、所得系统发生树均与生物学家的病毒分类知识相符,仅有四点例外:猴疱疹病毒CeHV-5脱离巨细胞病毒属;两个马科动物病毒EHV-1和EHV-4脱离水痘病毒属进化支;野兔痘病毒属的RFV和MYXV没有聚在一起;刺泡虫病毒ATCV-1脱离其他绿藻病毒。2、推断了多个病毒科间的亲缘关系,特别是为“将脂毛噬菌体和古噬菌体归为同一个病毒目”的建议提供支持。3、支持国际病毒分类委员会(ICTV)将病毒MSEV归入Beta类昆虫痘病毒属,并对尚未分类的病毒TuHV-1、CavHV-2和NeabNPV给出了分类建议。
以偏信息关联物种特异水平的分析结果为依据建立碱基关联矩阵,并对细小病毒科和6个病毒科的ssDNA病毒进行亲缘关系研究。得到如下结果:1、所得系统发生树与生物学家对病毒的分类相符,仅有两点例外:BFDV脱离圆环病毒科进化支;Chp2脱离衣原体微小噬菌体进化支。2、进化树中,依赖病毒和菜豆金黄花叶病毒进化支呈宿主-病毒结构,这表明碱基关联矩阵法可以反映宿主-病毒协同进化史。另外,本文发现番茄病毒存在非单源进化支。3、本文推断了ssDNA病毒家族间进化关系,并指出矮缩病毒、圆环病毒和联体病毒可能由共同祖先进化而来。4、碱基关联矩阵法支持ICTV对MV-L1、SVTS2、B5、BPV-3、BPV-2、AAV-7和AAV-8的现行分类,并对尚未分类的病毒DpDNV、AAAVa、CFDV、BgDNV、MpDNV、AdDNV、PcDNV、CpDNV和PmDNV给出分类建议,供生物学家参考。
本工作的创新之处包括:使用信息关联和偏信息关联标识基因组,并揭示了二者的系统发生信号特征;用统计方法揭示并定量评估偏信息关联的物种特异性;用改进的bootstrap方法分析进化树的分支结构;给出涵盖全部ssDNA病毒科的系统发生树。