论文部分内容阅读
甘蓝型油菜(Brassica napus,2n=38,AACC)是重要的油料作物,它是由二倍体祖先种白菜(Brassica rapa,2n=20,AA)和甘蓝(Brassica oleracea,2n=18,CC)经过自然杂交形成的异源四倍体植物,其形成历史较短,是一个相对年轻的物种,比较完整地保留了原始二倍体祖先的基因组结构,是研究异源多倍体基因组变异的重要模式植物。借助第二代测序技术(NGS)可以低成本、高通量地探究作物基因组上的遗传变异,从而推测群体演化历史、挖掘自然或人工选择信号、进行重要农艺性状的全基因组关联分析(genome-wide association studies,GWAS)。本研究中,我们从世界上主要油菜产区收集了238份甘蓝型油菜自交系并进行了全基因组重测序,挖掘了甘蓝型油菜的基因组遗传变异,深入分析了这些变异在甘蓝型油菜基因组上的分布及其对基因功能的影响。同时,我们也分析了这238份甘蓝型油菜的群体结构、遗传分化、遗传多样性和连锁不平衡(LD)水平等遗传特征,并鉴定出冬、春和半冬性三种生态型之间高度分化的基因组区域,主要结果如下:1.甘蓝型油菜基因组变异图谱和整合数据库的构建利用Illumina测序技术对238份甘蓝型油菜自交系进行了重测序,测序数据量平均为8.31Gb,基因组覆盖度平均为78.1%,覆盖深度平均为5.8倍。通过严格筛选,最终共得到了5,696,903个高质量SNPs和768,336个高质量InDels。分析发现,甘蓝型油菜的A和C亚基因组的遗传变异分布模式差异较大,主要表现为:A亚基因组的遗传变异密度约是C亚基因组的2倍;A亚基因组的遗传变异分布更均匀;C亚基因组积累了更多影响基因功能的变异。甘蓝型油菜的绝大多数基因存在多个拷贝。我们发现单拷贝基因的Nonsyn/Syn值以及大效应变异(Large Effect Variants,LEVs)比例均是多拷贝基因的2倍多,表明单拷贝基因可能没有多拷贝基因重要,暗示在甘蓝型油菜的驯化或育种过程中,单拷贝基因受到的选择压力更小,从而积累了更多影响基因功能的遗传变异。为了方便查询和利用SNP和InDel,我们构建了甘蓝型油菜基因组变异数据库(rapeseed genomic variation database,RGVD),包含了本研究中发掘的1210万raw variants及其功能注释等信息。用户可以使用“Search”和“JBrowse”功能模块来检索目标变异,检索结果以用户友好的页面展示。该数据库平台还整合了primer3.0和e-PCR软件,以方便使用者设计检测目标变异位点的引物,并分析引物的扩增特异性。2.甘蓝型油菜三种生态型的遗传特征和基因组分化群体结构分析表明,238个甘蓝型油菜可以划分为三个亚群,分别对应冬性、春性和半冬性甘蓝型油菜,进化树(neighbor-joining tree)以及主成分分析(PCA)也得到类似结果。群体遗传分化分析表明,甘蓝型油菜的A和C亚基因组在三种生态型之间的分化程度并不是对称的,对A亚基因组来说,半冬性/冬性之间的分化程度要明显大于半冬性/春性以及冬性/春性之间的,而三种生态型C亚基因组两两之间的分化程度却比较一致。此外,半冬性油菜A亚基因组的遗传多样性要明显高于另外两种生态型,而三种生态型C亚基因组的遗传多样性差异相对较小。进一步分析表明,白菜基因组(AA,2n=20)的渗入增加了半冬性油菜A亚基因组的遗传多样性,并提高了半冬性油菜与冬性和春性油菜A亚基因组的分化程度。我们在冬性与春性、半冬性与春性、半冬性与冬性油菜之间分别检测到39.85Mb、38.45Mb和38.32Mb高度分化的基因组区域,分别占基因组的6.17%、5.96%、5.94%,这些区域包含了许多影响花器官发育、光周期响应、春化需求、低温耐受性等环境适应相关的基因。分析发现,春化关键调控基因BnFLC.A02、BnFLC.A03b以及BnFLC.A10可能是调控甘蓝型油菜春化过程的重要基因。其中BnFLC.A03b和BnFLC.A10在三种生态型间明显分化,可能与甘蓝型油菜生态型形成有关。序列分析发现,在不同生态型中BnFLC.A10的启动子和编码区存在三种不同转座子,对转座子的选择引起了该基因在不同生态型间的分化,促进了不同生态型的形成。