论文部分内容阅读
十字花科芸薹属物种中包含了许多蔬菜以及油料作物,包括我们常见的白菜、甘蓝、芥菜和油菜。同时,芸薹属物种在进化过程中经历过数次多倍化事件,是研究多倍体进化的非常理想的实验材料。研究这些物种之间基因组上的变异,以及多倍化后重复基因保留上的异同,不仅能够对芸薹属农作物育种研究提供丰富的遗传变异信息,还能加深对植物多倍体进化的认识。芸薹属“禹氏三角”中目前已经有全基因组序列的物种有二倍体的白菜(B.rapa,AA)、甘蓝(B.oleracea,CC)、黑芥(B.nigra,BB),以及四倍体的甘蓝型油菜(B.napus,AACC)和芥菜(B.juncea,AABB),其中黑芥的基因组是利用四倍体芥菜中B亚基因组的遗传图谱连接,这使得我们无法研究B基因组的基因组在四倍体中发生的变异,以及比较芸薹属不同物种基因组序列上的差异。为了填补目前的黑芥基因组研究上的不足,我们对黑芥进行了全基因组测序,并结合Hi-C技术组装了染色体水平的全基因组序列。基于我们组装的黑芥全基因组序列以及已经发表的芸薹属其他物种的全基因组序列,我们分别分析了四倍体芥菜中B亚基因组上的变异,以及芸薹属A、B、C基因组中各染色体之间的进化关系。我们还比较了芸薹属A、B、C基因组中多倍化后重复基因的保留和丢失,分析了保留下来的重复基因在序列和表达量上的差异,以及这些基因在芸薹属四倍体中的直系同源基因的变异。我们利用二代测序技术对不同梯度片段大小的黑芥基因组DNA进行测序,组装到scaffold水平之后,利用Hi-C捕获的基因组内的连接来进行染色体水平的组装。最终我们得到了~484Mb染色体水平的黑芥基因组序列,其中有393Mb位于8条染色体水平的scaffold上,占组装总长的80%以上。我们的组装结果与已知的黑芥BAC序列,以及黑芥和芸薹属其他物种的EST序列均有非常高的覆盖度和一致性,并且在我们测序的黑芥5个组织的转录组比对中,均有80%以上的比对率。通过第三方的黑芥基因组测序数据比对,与已经发表的黑芥基因组序列相比,我们组装的黑芥基因组序列有更高的覆盖度和比对率。在这个组装结果中,我们鉴定到51,829个基因以及47%的重复序列,这些基因中超过92%能够与数据库中已知的蛋白序列比对上。我们通过比较芥菜中B亚基因组与黑芥基因组,全面的鉴定了四倍体芥菜B亚基因组上发生的变异,发现两者的共线性区域中,超过一半的区域发生过变异,并且发现这些变异区域与基因密度的负相关和与转座元件密度的正相关。我们鉴定了3个二倍体物种基因组之间的进化关系,并发现A、C分化之后C基因组发生了更多变异。在黑芥基因组中,我们发现了与其他植物多倍化后重复基因保留相同的功能偏向性。“转录调控”、“生物合成”和“运输”三个主要功能相关的基因更可能保留多份拷贝,而“DNA修复”和“应激反应”相关的基因则更倾向于保留一份拷贝,并且这些被偏向性保留的不同功能的重复基因表现出了不同的序列分歧度和表达量差异。“转录调控”相关的重复基因对之间有更高的序列分歧度,也倾向于同时低表达,而“生物合成”和“转运”等功能则在同时高表达的同源基因对中显著富集。在芸薹属四倍体中,我们发现转录调控基因序列的变异更少,表明转录调控相关的基因在新多倍体中受到更大的负选择压力。通过比较芸薹属3个二倍体物种古多倍化后重复基因保留的拷贝数,我们发现重复基因在这3个物种中的保留存在很大差异。进一步对这些在3个物种中保留情况不同的基因进行功能和表达量的分析,发现没有功能偏向性,并且表达量上也没有显著差异。综上所述,我们的研究提供一个有真实染色体信息的黑芥基因组序列以及相关的基因信息,为芸薹属植物的育种和进化研究提供了丰富的遗传信息。关于芸薹属植物基因组和重复基因的研究也促进了对芸薹属物种间进化关系的理解和多倍体植物进化的认识。