论文部分内容阅读
小叶杨是杨属中的重要树种,其广泛分布于北半球并且有着悠久的栽培历史。它是我国三北地区的重要树种,在防治荒漠化、减少水土流失、抵御风害以及修复沙丘等方面发挥着重要作用。虽然该树种在生态和经济方面具有重要的价值,但是有关小叶杨的遗传资源信息却十分缺乏,这阻碍了具有广泛适应性和商业性状的杨树新品种开发。1.本研究,利用三代测序PacBio Sequel平台、二代测序Illumina平台以及遗传连锁图谱相结合的组装策略获得了一个染色体水平的小叶杨基因组序列。基因组大小为441.38 Mb,包含686条contigs,contig N50为1.94 Mb。结合本实验室先前研究获得遗传连锁图谱,共有336条contigs成功的被锚定到19条染色体上,约占整个基因组大小的90.2%,此外,由于缺少标记或者标记间存在位置上的冲突,仍然有350条较短的contigs没有被锚定到染色体上。2.为了进一步提高基因组组装的完整性与准确性,本研究还结合了Hi-C技术辅助小叶杨基因组组装。通过ALLHIC软件成功的将653条contigs(435 Mb)挂载到19条染色体中,约占整个基因组大小的98.6%,仅有33条contigs没有被挂载到相应的染色体上。基因组完整性评估结果显示,在高等种子植物保守的1,375个BUSCOs基因集中,有1,347个完整的BUSCOs基因集可以在小叶杨基因组中获得,这表明小叶杨基因组组装的完整性达到了97.9%。二代测序、三代测序以及转录组测序的原始数据已经上传到NCBI的SRA数据库中,其Accession号分别为SRP071167,SRR9112943,SRR9887262和SR R9113443。小叶杨基因组数据可以在NCBI的GenBank数据库中获取,其Accession号为GCA_007827005.2。3.基因组重复序列分析结果表明,小叶杨基因组中41.47%为重复序列,其中40.17%为散在重复序列。结合从头预测、同源注释以及RNA-seq这三种方式,在小叶杨基因组中共预测到45,459个编码蛋白质的基因,其中有39,833个基因(87.6%)至少在一个基因功能数据库中被注释到。4.对小叶杨及其它3种杨树进行基因家族的聚类分析后发现:在小叶杨、毛果杨、美洲黑杨和胡杨中共获得了24,955个基因家族,其中,4个物种共有的基因家族数为15,556个(62.3%),3个物种共有的基因家族数为4,451(17.8%),两个物种共有的基因家族数为4,237(17.0%),仅有一个物种具有的基因家族数为711(2.8%)。将4个杨属物种共有的基因家族排除之外,我们进一步发现,胡杨与小叶杨、毛果杨、美洲黑杨中的一个或两个共有的基因家族数为996个,而剩下的3种杨树树种(小叶杨、毛果杨、美洲黑杨)中却有7,692个基因家族,这些分析结果说明:小叶杨与毛果杨、美洲黑杨的进化关系更近一点,而与胡杨的关系相对较远。系统发育学分析的结果表明,在杨属树种中,小叶杨和毛果杨应该被分类到不同的派别中,这与先前依据形态学的分类结果不一致。共线性的分析结果表明,小叶杨的基因组结构与毛果杨类似,没有发生大规模的染色体重排、倒位、易位等现象。基因家族的扩张与收缩分析表明,与其它8种植物基因组相比,小叶杨基因组中有2,356个基因家族发生了扩张,有5,224个基因家族发生了收缩。总之,小叶杨基因组序列的获得不仅为不同杨属树种间的比较基因组学和功能基因组学提供了重要的遗传资源,而且为识别小叶杨与其他杨树杂交产生的F1代群体中的基因组变异位点提供了最接近的参考序列之一。