论文部分内容阅读
杨树属植物自然分布在北半球,种间存在着广泛的形态变异和杂交渐渗,产生了诸多杂种,这使得杨树的遗传背景异常复杂。高度复杂的基因组越来越成为杨树育种和基因组研究的瓶颈。毛白杨是我国重要的乡土树种,被认为是白杨派的杂种,但由于缺乏确凿的基因组学证据,目前其起源、进化和遗传结构尚有争议。本研究针对毛白杨亲本起源与基因组进化这一科学问题,以毛白杨LM50为研究材料,通过花药诱导获得花药再生植株,以此作为基因组测序样本;联合采用Pac Bio+Hi-C+Illumina测序策略,进行毛白杨基因组测序、de novo组装与注释,获得了高质量的染色体级基因组,继而进行了亲本起源与进化事件分析、染色体结构变异分析、全基因组等位基因indel分析等,揭示了毛白杨的亲本起源与基因组进化事件;为进一步确证毛白杨亲本起源,通过细胞器基因组结构与进化分析,进行了毛白杨母本鉴定;在上述基础上,采用sg RNA文库转化法,开展了毛白杨高通量突变体创制初探。主要研究结果如下:(1)获得了毛白杨花药诱导再生植株以毛白杨优良无性系LM50为材料建立了花药再生体系(愈伤诱导培养基为H培养基+1.0 mg/L NAA+1.0 mg/L BA;分化诱导培养基为MS培养基+0.5 mg/L NAA+0.05 mg/L BA;生根培养基为1/2 MS添加0.3mg/L IBA),获得了27株花药再生植株,为毛白杨基因组测序提供了理想的材料。(2)提供了首个高质量的毛白杨基因组序列以毛白杨花药再生植株(GM15)作为试材,整合SMRT测序技术(Pac Bio)、Illumina校正和染色体构象捕获技术(HiC),进行毛白杨基因组测序、de novo组装与注释,获得毛白杨740.2 Mb二倍型基因组,由38个染色体组成,contig N50和scaffold N50大小分别为0.96 Mb和17.13 Mb,其中最长contig和scaffold分别达5.47 Mb和46.68 Mb,全基因组GC含量33.6%;结合后续系统发育进化分析和数个白杨派物种基因组和转录本数据,对Hi-C分析产生的染色体进行比对,成功将毛白杨基因组拆分为A(P.alba var.pyramidalis)、D(P.adenopoda)两个亚基因组(2×19个染色体);利用毛白杨转录组数据及蛋白质数据库注释鉴定出59,124个高质量基因,平均编码序列长度为1.31 Kb,平均每个蛋白质含430个氨基酸。(3)揭示了毛白杨亲本起源与基因组进化事件结合已发表的杨柳科树种基因组序列,进行同源基因聚类、共线性分析、遗传距离计算、发育进化树构建,结果表明杨属和柳属植物经历了一个共同的全基因组复制(WGD)事件(Ks≈0.25),白杨派和青杨派(毛果杨)之间的分化事件发生在约13.4 Mya。响叶杨是第一个独立的白杨派分支,约9.3 Mya分化。随后,山杨亚派和白杨亚派经历了一个分化事件(约8.4Mya)和各自的物种形成事件(约7.6-5.6 Mya,和4.8-3.9 Mya)。新疆杨是银白杨在约4.8 Mya产生的一个独立变种。推测大约在3.9 Mya,响叶杨与新疆杨杂交产生了毛白杨。基于新疆杨全为雄性这一客观事实,再结合后续毛白杨叶绿体基因组数据的系统发育分析可以推断,在毛白杨的杂种形成过程中,新疆杨和响叶杨分别扮演着父、母本的角色。(4)鉴定了毛白杨染色体结构变异与等位基因indel特征通过对毛白杨亚基因组间比较分析发现,存在丰富的染色体结构变异,共检测到15,480个结构变异,包括:6,654个INS(insertion)、6,231个DEL(deletion)、1,602个INV(inversion)、694个TRANS(translocation)和299个CNV(copy number variation),其中INS和DEL占83%,其余三种变异类型占27%。另外共检测到188,575个等位基因indels,分布在毛白杨38条染色体的15,052个等位基因上。(5)揭示了毛白杨细胞器基因组特征与母本起源采用三代测序技术对毛白杨细胞器基因组进行测序、组装、注释,细胞器基因组特征与进化分析表明,白杨派叶绿体基因组序列高度保守,重复类型的数量和分布也相似且保守。白杨派物种间的IR和SC边界位置略有不同,白杨派叶绿体基因组序列上有7个相对较大的插入,编码区比非编码区更保守;进一步通过六个白杨派叶绿体基因组遗传发育系统进化分析,显示毛白杨和响叶杨关系最为密切,根据细胞器遗传的母本溯源性,推断响叶杨为毛白杨的母本,进一步支持了结果(3)毛白杨亲本起源的推论。(6)探索了毛白杨高通量突变体创制新途径根据杨树MYB基因家族及花青素合成途径相关基因设计并进行化学合成约2,500个sg RNAs,构建CRISPR/Cas9-sg RNAs文库并在杨树中进行了遗传转化,共获得286个转化株系。经PCR检测,其中94株呈阳性,阳性植株占32.87%。其中单靶点株系54株,多靶点株系40株。对目的基因进行克隆测序,结果表明22个目的基因靶位点序列发生变异,突变率为23.40%。首次在毛白杨中尝试用sg RNAs文库转化实现高通量突变的新方法,为采用基因编辑技术高通量创造突变体和发掘功能基因、进行分子设计育种奠定基础。