论文部分内容阅读
自从大肠埃希菌(Escherichia coli)DNA的放射自显影报告首次证明其基因组由单一的环形染色体组成以来,人们一直认为所有细菌基因组都是由单一的环形染色体组成。随着测序技术的发展,在呈现爆炸式增长的细菌基因组测序结果中显示,大约10%的细菌基因组还拥有第二染色体。第二染色体携带细菌生长的核心基因,同时还拥有质粒一样的复制系统。已发现许多重要细菌的基因组中都含有第二染色体,例如植物共生菌和人畜共患菌等。但对第二染色体的形成机制和存在的意义还不清楚。Flammeovirga sp.细菌是典型的多糖高效降解菌。Flammeovirga sp.MY04是课题组分离自海岸沉积物中的一株富含多糖降解酶资源的菌株。目前已经从MY04菌株中克隆、鉴定了一系列的糖基水解酶如琼胶酶、甘露糖水解酶和多糖裂解酶如褐藻胶裂解酶、黄原胶裂解酶的基因。然而,关于Flammeovirga sp.属细菌仅见一个基因组草图的报道,未见任何关于完整基因组的正式报道,由于缺乏该属菌株基因组的组成、结构与功能的信息,导致进一步深入了解其生态功能、特色及其遗传学基础是困难的。所以我们结合二代和三代测序技术对MY04菌株的全基因组进行了测序,拼装和注释,并对其复制子进行的命名。通过COG功能注释,CAZy功能注释,耐药基因预测,前噬菌体预测,CRISPRCas系统和限制性内切酶分析预测,我们对MY04菌株的不同染色体的功能进行了比较分析;通过BLAST对MY04菌株不同染色体的重复基因和水平转移基因进行了鉴定和功能注释;通过与本属内其它基因组的对比进行了同源性分析和进化树的构建及选择压力的计算;通过对本属其它标准菌株的基因组的测序、拼装和注释,然后进行了进化和功能分析;通过设置不同的氯化钠浓度的培养条件来测定转录组,比较不同复制子的基因表达情况。本文的主要研究成果如下:1.MY04菌株全基因组的测序、拼装与注释显示其有三个复制子:chromosome 1(5.06Mb,4063 个基因);chromosome 2(2.19 Mb,1478 个基因);plasmid(0.08 Mb,71 个基因)。2.MY04菌株不同染色体的功能分析显示:COG G和COG P在染色体2上显著富集,COG J,COG E,COG I等则在染色体1上富集;染色体2中有高达11.26%的蛋白被注释为Glycoside Hydrolases(GH),而染色体1中则仅有2.34%,其中,GH2、GH3、GH16、GH29、GH74、GH82、GH86、GH92、GH117 和 GH136明显在染色体2中富集;染色体1上有14个预测的耐药相关基因,染色体2上有7个预测的耐药基因;染色体1和质粒上各有一个前噬菌体区域,而染色体2上没有;染色体1上有一个完整的Ⅰ型R-M系统,3个Ⅱ型R-M系统(两个完整);染色体2上有3个完整的Ⅰ型R-M系统;质粒上不存在任何R-M系统;染色体1上有三个CRISPR系统区域,为退化CRISPR序列,并不存在Cas蛋白,染色体2上没有任何CRISPRCas系统;质粒上有一个较大的CRISPR区域和6个Cas蛋白。3.MY04菌的不同染色体上的重复基因和水平转移基因分析显示:染色体1上有26.83%的重复基因,染色体2上有43.17%的重复基因,质粒上有39.44%的重复基因;染色体1中有1.6%的HTG,染色体2上有6.6%的HTG;染色体1上有0.49%的转座酶,染色体2上有1.62%的转座酶,质粒上有5.63%的转座酶;染色体1重复基因集中在碳水化合物和无机离子的转运与代谢(COG G/P)中,染色体2重复基因集中在信号转导和细胞膜生物发生(COGT/M)中;重复基因进化树构建显示,染色体间重复基因进化树为B型,染色体内重复基因进化树为A型。4.比较基因学组分析结果:基于全基因组序列的系统发育分析显示,与MY04 菌株最相似的菌株是F.yaeyamensis sp.NBRC 100898 和F.kamogawensis strain DSM 26273;MY04菌株两个染色体与同属其他菌株的同源性分析显示,染色体1具有更高的同源性;进化压力分析显示,染色体1基因Ka/Ks值的中位数为0.117,染色体2基因为0.143,质粒基因为0.198,染色体2具有较低的进化选择压力;Flammeovirga sp.属标准菌株进行全基因组测序结果显示它们的基因组都包含第二染色体。对MY04菌株和这些基因组的共线性分析显示,染色体1进化保守,染色体2具有可塑性。于是对这些基因组中两个染色体编码蛋白的功能偏好进行分析,结果显示,与MY04菌株类似,它们的染色体1编码的蛋白也负责核心细胞功能,染色体2则对碳水化合物和无机离子的转运与代谢具有偏好性。5.MY04菌株转录组初步分析显示:0.9%氯化钠浓度下的MY04菌株差异表达基因在核糖体的组装,部分氨基酸的代谢,氮代谢,碳代谢等通路上显著富集,2%氯化钠浓度下的MY04菌株差异表达基因在碳代谢通路中显著富集,4%氯化钠浓度下的MY04菌株差异表达基因在脂肪酸代谢,信号转导,碳代谢通路中显著富集;对每组浓度的注释为COGP的差异基因进行统计,随着氯化钠浓度的提高,无机离子的转运与代谢相关基因的差异表达呈现上调基因比例增多,下调基因比例减少;在0.9%,2%氯化钠浓度的时候,COGP差异基因在染色体2上的分布丰度大于染色体1,而在4%的时候,两者丰度相同。综上,本文研究首次完成了Flammeovirga sp.属MY04菌株基因组的完成图测序,并从功能和进化两个方面对其不同复制子的差异进行了比较分析,发现了其两个染色体在菌株生存中扮演了不同的角色,染色体1维持菌株基本生存,染色体2促进菌株更好的适应环境,这支持了多复制子存在优势中的适应新的生态龛观点。而两个染色体在进化上的差异体现在,染色体1进化保守,染色体2具有更强的可塑性,而且染色体2具有质粒的特征,一定程度上支持了多复制子是由质粒进化而来的假说。这基本回答了该菌株第二染色体形成的可能原因和特色功能,为多复制子系统的研究提供了参考。特别是第二染色体上富集多糖降解酶,这将为从基因组角度开发和利用工具型糖酶资源提供理论支持。同时对该属标准菌株的基因组测序和功能分析说明,具有多个染色体可能是该属的共同特征,而且这些额外的染色体在促进该属菌株适应环境方面具有重要意义,且它们对海洋碳循环发挥了重要作用。