论文部分内容阅读
草菇是一种重要的常规栽培种类,其栽培起源于我国,具有悠久的栽培历史,在国际上有"中国菇"之称。草菇味道鲜美,营养丰富,并具有一定的保健作用,在中国的华南地区及东南亚等地区一直很受欢迎。草菇是食用菌中主要的草腐菌,以稻草、麦秆、废棉为生长基质。但是草菇的生物学转化率比较低,一般只有20%,远远低于其它食用菌100-150%的生物学转化率。草菇一个特有的生物学性状是在摄氏4度低温下发生自溶,这使得草菇成为唯一不能低温储运的食用菌。这也导致草菇的货架期很短,从而极大地限制了草菇栽培的普及。如何解决这些问题,多年来一直是食用菌遗传育种科研工作者努力研究的目标。由于对草菇的遗传学背景的了解比较薄弱,因而在分子水平上对草菇的分解木质纤维素和低温自溶的机理的研究一直没有重要的突破。近年来,新一代高通量测序技术的出现,显著地提高了基因组测序的速度,并大幅度地降低了测序成本,这为完成真菌类物种的全基因组序列提供了很好的机遇。通过完成草菇的全基因组测序计划,可以在全基因组水平上了解草菇降解木质纤维素的机制。并结合诱导变异型菌株基因组测序,开展其与野生型菌株的比较基因组学分析,有望了解草菇低温自溶分子机理,这些研究成果将为进一步运用基因修饰手段提高草菇分解基质的能力和耐低温的能力奠定坚实的基础。本研究采用Roche公司的454 GS FLX测序技术和Illumina公司的Solexa测序技术分别对草菇的单孢分离菌株进行了从头(de novo)全基因组序列测定,充分利用两种不同特点测序技术获得的结果,完成了草菇野生型全基因组框架图的构建,进行了初步的基因组结构和基因功能的生物信息学分析。用Roche 454 GS FLX测序技术,得到序列总长714,488,913 bp,测序覆盖率为20倍。通过Newbler软件拼装,得到LargeContigs(>2 kb)1,289个,Contig总长度为35.60Mb。采用Illumina solexa测序技术进行了DNA片段配对末端(paired-end)测序,测序长度为2*100bp,得到30,884,166对序列,基因组覆盖率为170倍。应用Velvet软件进行拼装,得到Large Contigs(>2 kb)4,022个,总计大小32.37Mb。运用独立开发的软件,将上述两组数据整合后得到Large Contigs(>2 kb)997个,Contig总长度为36.45Mb。平均Contig长度为40,218 bp,最长的Contig长度为1.04Mb,N50Contig长度为86,492 bp。再通过pair-end和Solexa 3K Matepair测序,插入片段平均大小为2-3k,对上述得到的Contig进行组装得到62个Scaffold。利用四款基因预测软件对62个Scaffold序列进行基因预测,并且以草菇EST序列的分布情况进行过滤,共得到了个基因。,共获得11,084个蛋白编码基因。平均编码序列(CDS)长度为1,532 bp,每个基因平均长度为1,948 bp,每个基因平均含有有6个外显子。通过与swiss-prot,KEGG的真核基因和蛋白数据库等进行比对,对预测基因进行了功能注释,其中有5,516个基因有明确的功能注释信息。通过KOG和GO分类,可以把4,821个基因分到25个功能类别中(KOG),1,462个基因可以进行GO分类。随后,通过KEGG代谢数据库,构建了草菇的代谢通路,发现了糖酵解、三羧酸循环等完整代谢通路。本研究在国际上首次完成了草菇的全基因组框架图,确定出草菇的基因组为36.45Mb,这远远大于通过脉冲电泳技术估算出的25Mb的基因组长度。本研究采用454 GS FLX和Solex GA两种新一代高通量测序技术相结合的方式,充分利用两种技术的不同优势,以较低的成本,高质量地完成草菇全基因组测序和框架图的构建。本研究所尝试的整合测序技术将会促进食用菌全基因组学和比较基因组学研究的广泛开展,从而能够提供全面和深入的食用菌遗传学知识,快速推动食用菌分子遗传学和分子育种学的进步。