论文部分内容阅读
基因组学与转录组学技术的快速发展,能够为加快作物的基础研究进程提供助力,并且已经利用该技术在番茄、玉米、水稻等作物中解析了一批重要农艺性状的形成机理。辣椒是世界上最重要的蔬菜之一,其种植面积与经济效益均位居蔬菜作物前列。2014年韩国与中国分别完成了辣椒参考基因组的组装,为基因组学与转录组学应用于辣椒复杂农艺性状的解析奠定了基础。本研究以全基因组重测序和转录组为基础组装了辣椒泛基因组,此外,对辣椒素、辣椒红素、簇生花序和雄性不育4个重要的农艺性状进行研究,主要的研究结果如下:
(1)辣椒泛基因组的组装。为了更好地了解基因组变异对辣椒植物表型的影响,对383份辣椒种质材料进行了约11倍深度的全基因组重测序。将重测序的reads进行组装,将总长度为956Mb包含610292个新contig的数据与已发表的参考基因组Zunla-1与重测序获得的数据进行组合,共同组装到辣椒泛基因组。从组装的辣椒泛基因组中共预测到51757个高质量的基因,其中28930个被定义为核心基因。对预测到的基因进行基因存在-缺失变异(Presence-Absence Variations,PAV)分析,根据PAV聚类分析表明383份种质材料能够非常明显的地聚成4个不同的组,与基于表型组学数据对4个栽培种的分类结果一致。
(2)基于PAV的全基因组关联分析(Genome Wide Association Analysis, GWAS)。为了揭示辣椒基因和性状之间的关系,我们建立了一个PepperPan(http://47.74.21.101:8012/pepperpan )网站和数据库,并且构建了一个基于JBrowse的网络界面使用户能够浏览、搜索、可视化383份种质材料中任何一份的基因注释和reads比对数据。通过PAV-GWAS分析辣椒果实中的辣椒素和辣椒红素含量与基因PAV的关系,关联结果表明Ccs基因(pan06g005570,辣椒红素/辣椒素合成酶)的PAVs与果实中的辣椒红素含量显著相关。26个具有黄色或者橙色果实材料的reads覆盖率比对明确揭示了Ccs(pan06g005570)基因组区段存在2种类型的缺失,与红果品种NJ03相比所有这26个品种中24个在Ccs基因区域存在4.43kb缺失,2个在Ccs基因区域存在2.96kb缺失,证实了GWAS的结果。我们还研究了八氢番茄红素合酶基因(Psy)的reads覆盖率,发现4个非红色果实的种质材料具有相同的20kb缺失,覆盖了pan04g025380(Psy)的整个基因区域。此外,对辣椒素的研究发现在51份低辣椒素含量种质材料的Pungent1(Pun1,pan02g021380)基因区域内和周围存在2.5kb缺失。
(3)基于基因组学与转录组学的辣椒簇生性状基因的定位与候选。本研究从现有的种质材料中筛选到一个命名为CL74的簇生花序突变体,CL74的遗传分析表明其簇生花序性状由单隐性核基因控制。利用F2群体进行基因定位与连锁分析,根据集群分离分析(Bulked Segregant Analysis, BSA)和连锁分析结果显示候选基因被定位到标记Indel-197064077和Indel-198110136之间物理距离约为998kb的区段。在候选区域有两个MADS-box基因Capanan11g001832和Capanan11g001834,与单生花序的植株相比,簇生材料CL74中Capanan11g001832的基因区存在两个SNP。通过F2群体验证了两个SNP与簇生花序表型完全共分离,因此推测Capanan11g001832是簇生花序强有力的候选基因。此外,转录组分析表明,三个WUSCHEL-like的基因(Capana00g000667,Capana06g000476和Capana11g000671)在CL74中下调,CLV1(Capana04g000175)在CL74突变体中上调。我们推测基因Capanan11g001832,Capanan11g001834,三个WUSCHEL-like基因和CLV1之间存在复杂的关系,这些基因可能共同调节辣椒中簇生花序的形成。
(4)辣椒细胞质雄性不育系(Cytoplasmic male sterility,CMS)9704A与保持系9704B在花蕾发育过程中编码与长链非编码RNA(long non-coding RNA, LncRNA)表达模式分析。基于转录组测序技术在9704A与9704B的S1,S2和S3三个时期分别鉴定出547、976和2416个差异表达基因,并且超过70%的差异基因在不育系中下调表达。同时,在9704A与9704B中总共鉴定出10655个LncRNA,其中1137个LncRNA在检测的3个时期中均存在差异表达,并对它们进行顺式和反式靶基因预测。此外,差异基因与靶基因的GO富集和KEGG通路分析结果均与花粉发育高度相关。本研究为以后进一步深入研究编码基因以及LncRNA在雄性不育形成中的功能奠定了基础,为解析细胞质雄性不育的调控机制提供参考。
(1)辣椒泛基因组的组装。为了更好地了解基因组变异对辣椒植物表型的影响,对383份辣椒种质材料进行了约11倍深度的全基因组重测序。将重测序的reads进行组装,将总长度为956Mb包含610292个新contig的数据与已发表的参考基因组Zunla-1与重测序获得的数据进行组合,共同组装到辣椒泛基因组。从组装的辣椒泛基因组中共预测到51757个高质量的基因,其中28930个被定义为核心基因。对预测到的基因进行基因存在-缺失变异(Presence-Absence Variations,PAV)分析,根据PAV聚类分析表明383份种质材料能够非常明显的地聚成4个不同的组,与基于表型组学数据对4个栽培种的分类结果一致。
(2)基于PAV的全基因组关联分析(Genome Wide Association Analysis, GWAS)。为了揭示辣椒基因和性状之间的关系,我们建立了一个PepperPan(http://47.74.21.101:8012/pepperpan )网站和数据库,并且构建了一个基于JBrowse的网络界面使用户能够浏览、搜索、可视化383份种质材料中任何一份的基因注释和reads比对数据。通过PAV-GWAS分析辣椒果实中的辣椒素和辣椒红素含量与基因PAV的关系,关联结果表明Ccs基因(pan06g005570,辣椒红素/辣椒素合成酶)的PAVs与果实中的辣椒红素含量显著相关。26个具有黄色或者橙色果实材料的reads覆盖率比对明确揭示了Ccs(pan06g005570)基因组区段存在2种类型的缺失,与红果品种NJ03相比所有这26个品种中24个在Ccs基因区域存在4.43kb缺失,2个在Ccs基因区域存在2.96kb缺失,证实了GWAS的结果。我们还研究了八氢番茄红素合酶基因(Psy)的reads覆盖率,发现4个非红色果实的种质材料具有相同的20kb缺失,覆盖了pan04g025380(Psy)的整个基因区域。此外,对辣椒素的研究发现在51份低辣椒素含量种质材料的Pungent1(Pun1,pan02g021380)基因区域内和周围存在2.5kb缺失。
(3)基于基因组学与转录组学的辣椒簇生性状基因的定位与候选。本研究从现有的种质材料中筛选到一个命名为CL74的簇生花序突变体,CL74的遗传分析表明其簇生花序性状由单隐性核基因控制。利用F2群体进行基因定位与连锁分析,根据集群分离分析(Bulked Segregant Analysis, BSA)和连锁分析结果显示候选基因被定位到标记Indel-197064077和Indel-198110136之间物理距离约为998kb的区段。在候选区域有两个MADS-box基因Capanan11g001832和Capanan11g001834,与单生花序的植株相比,簇生材料CL74中Capanan11g001832的基因区存在两个SNP。通过F2群体验证了两个SNP与簇生花序表型完全共分离,因此推测Capanan11g001832是簇生花序强有力的候选基因。此外,转录组分析表明,三个WUSCHEL-like的基因(Capana00g000667,Capana06g000476和Capana11g000671)在CL74中下调,CLV1(Capana04g000175)在CL74突变体中上调。我们推测基因Capanan11g001832,Capanan11g001834,三个WUSCHEL-like基因和CLV1之间存在复杂的关系,这些基因可能共同调节辣椒中簇生花序的形成。
(4)辣椒细胞质雄性不育系(Cytoplasmic male sterility,CMS)9704A与保持系9704B在花蕾发育过程中编码与长链非编码RNA(long non-coding RNA, LncRNA)表达模式分析。基于转录组测序技术在9704A与9704B的S1,S2和S3三个时期分别鉴定出547、976和2416个差异表达基因,并且超过70%的差异基因在不育系中下调表达。同时,在9704A与9704B中总共鉴定出10655个LncRNA,其中1137个LncRNA在检测的3个时期中均存在差异表达,并对它们进行顺式和反式靶基因预测。此外,差异基因与靶基因的GO富集和KEGG通路分析结果均与花粉发育高度相关。本研究为以后进一步深入研究编码基因以及LncRNA在雄性不育形成中的功能奠定了基础,为解析细胞质雄性不育的调控机制提供参考。