论文部分内容阅读
巴西橡胶树(Hevea brasiiensis)属大戟科植物,是一种天然的产胶植物和重要的经济作物。目前分子标记技术应用在橡胶树研究方面已取得一定进展,但关于橡胶树分子生物学研究还很欠缺。已构建的橡胶树连锁遗传图饱和度不够,许多功能基因在染色体组上位置和连锁关系尚未确定,直接应用于橡胶树育种难度较大。而从单条染色体入手,构建单条染色体文库,对单条染色体进行高通量测序和基因功能注释,可有效解决上述问题。在目前国内外有关橡胶树文库构建的研究仅在全基因组文库或cDNA文库方面,除了本课题组成员从2013年开启橡胶树单染色体文库构建工作外,与橡胶树单染色体文库构建方面相关的研究所见较少。而在橡胶树高通量测序方面,目前仅在RRIM品种全基因组测序草图和其他品种的转录组方面的测序,单条染色体高通量测序报道罕见。本研究采用巴西橡胶树单染色体显微分离体系分离热研7-33-97单染色体,一方面利用LA-PCR法扩增单条染色体后构建单染色体微克隆文库;另一方面,利用单细胞全基因组扩增法扩增单条染色体后进行Illumina高通量测序。旨在为橡胶树基因组研究提供新的思路与方法,为分子辅助育种提供理论基础。具体研究结果如下:(1)以巴西橡胶树热研7-33-97幼叶为材料,采用酶解去壁低渗法制备染色体标本,选择酶解时间为7h40min,后低渗时间为30min,可获得高质量的染色体标本。采用实验室自建的橡胶树玻璃针显微分离技术体系,成功地从橡胶树中期分裂相细胞中分离出29条单染色体。随机挑选出3条,采用LA-PCR法对单染色体进行体外扩增,通过Southern杂交证实扩增产物来自巴西橡胶树基因组;将这3条染色体的LA-PCR二轮扩增产物用DIG标记成探针,经荧光原位杂交(FISH)验证并结合核型分析确定出这三条染色体的序号分别为热研7-33-97的第10、11及14号染色体。(2)构建了巴西橡胶树热研7-33-97的第10、11及14号染色体的微克隆文库,分别获得了 1.8×105个、2.4×105个、1.5×105个克隆子,插入片段范围为200-1100bp、200-1100bp、300-1100bp,平均插入片段分别约为400bp、450bp、450bp,文库的覆盖率依次约为7倍、5倍、5倍,空载率分别为5%、4%、5%。(3)分别随机对热研7-33-97的第10、11、14号染色体文库中的各100个阳性克隆子进行了测序,测序后分别得到100、100、94条序列,去除重复序列后依次有有93、91、86条。将这些序列进行BLAST在线同源比对,与橡胶树(RRIM600)WGS文库同源性大于90%的各为1、3、3条,与橡胶树EST文库同源性大于90%的分别为1、3、4条。(4)将三个染色体文库与橡胶树的全基因组数据库和EST数据库高同源的序列进行Blast2GO软件分析。第10号染色体文库中的有2条序列用Blast2GO软件分析后,共计获得了7个GO术语注释结果,其中2个有关生物学途径方面,5个有关分子功能方面,进而对序列进行Enzyme Code和KEGG代谢途径的分析,获得2个酶注释,酶ID号为EC3.6.1、EC3.6.15,参与嘌呤代谢、硫胺素代谢KEGG两条代谢途径;第11号染色体文库中有6条序列用Blast2GO软件分析后,未获得GO术语注释结果,只获得了 2条序列有8个GO MAP结果,表明这两条序列与这些GO序列有一定的同源性,这些GO中,3个有关生物学途径(P)方面,3个有关细胞组件(C)方面,2个有关分子功能方面;第14号染色体文库中的有7条序列用Blast2GO软件分析后,共计获得11个GO术语注释结果,有关分子途径(P)方面的有5个,有关细胞组件(C)的有5个,有关分子功能(F)的有1个,进而对序列进行Enzyme Code和KEGG代谢途径的分析,获得2个酶注释,酶ID号均为EC2.7.7.49,但未获得代谢途径结果。(5)从分离的染色体中随机选择一条单染色体,用单细胞全基因组扩增(MALBAC)法对其进行体外扩增。Southern杂交证实其扩增产物来自于巴西橡胶树基因组,经荧光原位杂交(FISH)和核型分析确定出这条染色体为热研7-33-97的第4号染色体。(6)对热研7-33-97的第4号染色体二轮扩增产物进行Illumina平台高通量测序。测序结果双重过滤后进行分析统计,得到与橡胶树基因组匹配上的Reads为100 bp的有效序列770470条,又经变异检测得到SNP位点共8019个,InDel位点82个,SV位点184个。(7)本研究从热研7-33-97的第4号染色体三重过滤后的clean reads中随机挑选出2000条与橡胶树(RRIM600)基因组数据库进行在线比对,同源性达90%以上的序列有1846条。随机挑选3000条序列与在库的EST序列同源性达90%以上的序列有25条,进而对与在库的EST序列高同源性的24条序列用Blast2GO软件分析后,共计获得5个GO注释结果,其中属于生物学途径(P)方面的有1个,细胞组件(C)方面的有1个,分子功能(F)方面的有3个,进而对序列进行Enzyme Code和KEGG代谢途径的分析,未有序列注释到相关酶功能和KEGG代谢途径。