论文部分内容阅读
蜡状芽胞杆菌(Bacillus cereus)群包括产炭疽毒素的炭疽芽胞杆菌(B. anthracis),机会致病菌蜡状芽胞杆菌(B. cereus),产杀虫晶体蛋白并且被广泛用于生物防治的苏云金芽胞杆菌(B. thuringiensis),以及其它几种芽胞杆菌。正是由于其中一部分菌株对人类健康构成威胁,而另一部菌株则可以用于生物农药的开发,而且这个群的菌株广泛存在于自然界的各个生境,对于菌株之间的区分一直以来受到研究者的重视。由于已经报道的针对于B. cereus群的鉴定分型方法分辨率不够,很多不同的菌株不能有效地相互区分。对于B. thuringiensis菌株而言,由于挖掘更多的具有应用价值的活性物质需要分离鉴定到更多的新型菌株,而传统的使用H-血清型鉴定的方法已经停止使用,所以急需建立新型有效的鉴定方法。大规模的基因组测序数据的公开,为研究新型的用于区分的新型基因提供基础。本研究着眼于寻找新型的基于核苷酸序列的菌株分型方法,并且研究分型结果所反映的生态与进化的规律,为B.cereus群菌株大规模的鉴别以及进化研究提供理论基础。同时考察新型分型系统对于B. thuringiensis菌株的鉴定的有效性。由于水平基因转移是细菌基因组的主要驱动力,而质粒是这个过程中的主要媒介,因此对于质粒的起源、进化、动态以及与染色体的具体关系的研究对于解释微生物基因组的进化规律至关重要。B. cereus群不同的菌株含不同数量、不同种类以及不同大小质粒,有些菌株甚至含有超过10个大小从2kb到600kb的质粒,而且本实验室以前的研究显示,在同一个菌株中,质粒上遗传物质的生物量甚至大于染色体上的。因此,研究B. cereus群质粒的进化以及与染色体之间的关系可以为我们认识质粒在细菌进化中的作用与地位提供帮助。同时,到目前为止,超过100个来自B. cereus群的质粒的基因组序列被公开,为系统性地研究质粒的进化与动态提供基础。本研究着重研究普遍存在于B. cereus中的大于100kb的质粒的进化,以及把整个B. cereus群质粒作为一个整体,研究其与染色体之间的关系,在细菌种群水平揭示质粒的起源于动态以及对于种群形成和稳定的作用。通过分析大量的B. cereus群菌株的基因组,我们发现其中含有大量的具有潜在生物活性物质的基因。其中,细菌素的合成基因簇是非常丰富的一类。细菌素是-类对于与产生菌近缘的细菌有活性的抗微生物物质,其化学本质是由核糖体合成的多肽或者蛋白质类物质。其在医学中的潜在应用以及在微生物生态中重要作用,使其越来越受重视。由于芽胞杆菌同时也是人类微生物组中的主要成员,本研究通过研究人类不同身体位点微生物组中细菌素的多样性以及分布规律,结合各个微生物组的细菌群落组成,尝试揭示细菌素在人类微生物组的动态平衡中的重要作用。1)使用csaB基因对B. cereus群菌株进行分型能够反映其宿主类型目前很多标志基因被用来鉴定和区分蜡状芽胞杆菌(B. cereus)群不同的菌株,但是大部分的标志基因序列变异性较低,区分效果不理想。本研究报道一个S-层蛋白锚定相关基因csaB来区分B. cereus群菌株以及评估其在苏云金芽胞杆菌(B.thuringiensis)菌株鉴定与区分中的作用。首先,csaB的系统发育树与已报道的标志基因的系统发育树具有相似但不相同的拓扑结构,而序列具有更大的变异性,不同菌株之间的一致性在78%~100%,而其它已经报道过的标志基因,不同菌株之间的一致性一般都在85%以上。我们测序获得76株B. thuringiensis菌株的csaB基因,结合从Genbank获得122株B. cereus群菌株获得的序列,构建系统发育树。所有被分析的群菌株主要被聚集到两个大的类群。其中,所有的B. anthracis菌株具有相同的csaB基因,可以与其它的菌株区分开,而B. cereus和B. thuringiensis菌株则不能被相互区分开,来自这两个种的菌株离散地分布于两个类群中。基于两个大类,超过80%分离自高等动物的菌株集中在Ⅰ类,22株分离自昆虫的菌株中,20株集中在Ⅱ类,而分离自土壤的在两个大类中均匀分布。并且一些有助于细菌粘着以及编码与高等动物相互作用的表面蛋白的基因,SLH蛋白基因的数目,Ⅰ类菌株的基因组中显著性(P<2.2e-16, Mann-Whitney test)地高于Ⅱ类菌株的基因组中。我们推测两个大类可能反映出B. cereus群的两种不同的动物宿主,即高等动物和昆虫。2)使用csaB基因能够对B. thuringiensis菌株进行有效的区分我们分析了来自70个血清型的109个B. thuringiens菌株,发现它们共享44个基因型,其中22个代表一个血清型,而19个代表两个或者更多个血清型。同时,我们发现,同一血清型的不同亚型可以明显地被分开,而同一血清亚型或者血清型(没有亚型)的菌株被聚集在一起。结合已报道的鞭毛蛋白序列,所有的血清型以及亚型都可以被明显地区分开。总之,基于csaB基因的分型既可以对B. cereus群的菌株进行更精细的识别,同时可以反映B. cereus群祖先的两种不同动物宿主类型,也可以作为一种对B.thuringiensis菌株进行鉴定区分的技术。3)B. cereus群中大于100kb的质粒起源于由较小的质粒融合事件大部分B. cereus群菌株富含丰富的质粒,有的甚至超过10个。同一菌株中,不同质粒的大小各不相同,最大的可以到600kb,最小的只有2kb。目前B. cereus群的质粒都是零散地被研究,大部分质粒只被报道了序列或者复制方式,对于系统地把整个B. cereus群的质粒当成一个整体来研究的没有报道。作为水平基因转移中非常重要的载体,质粒在细菌基因组进化过程中起着至关重要的作用。许多细菌菌株含有多个质粒,但是这些质粒的起源,进化和动态变化规律,以及质粒和染色体之间的关系并不清楚。本文中对这些话题的研究主要通过关注来自B. cereus群的质粒。我们首先通过研究质粒的最小复制子探讨了31个大于100kb的质粒的起源,进化与动态规律。这些质粒上的65个潜在的最小复制子可以根据复制相关蛋白基因以及可能的复制起点分为6个大的类型。31个大质粒中的29个含有两个及其以上的最小复制子。基于复制相关蛋白序列的系统发育树显示位于同一质粒上的不同的最小复制子具有不同的进化历史。因此,我们推测这些大质粒起源于较小的质粒的融合事件。由于存在于同一菌株中的质粒必须相容,而且B. cereus群中共存于同一菌株中的不同大质粒的最小复制子属于不同的组或者亚组,因此,最小复制子的不同亚组可能决定着不同的不相容组性。更为广泛地分析1285个具有可预测的最小复制子的细菌质粒显示,34%(443)的质粒具有两个或者两个以上的最小复制子,并且这些质粒的基因组大小显著性地大于具有一个最小复制子的质粒。因此,我们推测,由质粒融合事件形成较大质粒的现象在质粒的进化过程中普遍存在。4) B. cereus群中的质粒是其染色体基因冗余的载体我们收集到104个已知序列的B. cereus群质粒,通过关注质粒和染色体之间的共有基因(shared genes)来探究质粒和染色体之间的关系。一些基本特征,例如碱基组成(base composition)和密码子选择(codon usage)分析显示位于质粒上的基因更接近于染色体上的可变基因,而非染色体的核心基因。尽管所有的染色体基因的COG功能类别在质粒的基因中均有代表,但是其比例差异明显。当关注共有基因在质粒和染色体上的分布时,我们发现它们均匀分布。但是,相同的共有基因在染色体和质粒上具有不同的启动子和(或)终止子序列,因此在转录水平上受不同的元件调控。我们推测为适应多变的环境,适应性相关的基因可以同时存在于质粒和染色体上,为保证这种冗余只存在于基因水平,这些共有基因通常受不同的调控元件控制。5)人类微生物组中细菌素基因的多样性大量B. cereus群菌株基因组序列被公开,使得通过基因组学的方法全面挖掘其与其它微生物以及宿主之间相互作用因子成为可能。我们预测到大量的具有潜在生物活性的物质,包括蛋白酶、抗生素以及细菌素。基于我们的预测,多个课题小组开展了相关的实验验证工作,部分成果已经公开发表。本文重点关注细菌素。细菌素通常对于产生菌近缘的细菌具有毒杀作用,因此它们在微生物群落生态中作用非常重要。人类不同的身体位点是不同微生物群落的天然栖息地,不同的位点具有不同的微生物圈,每个微生物圈中,细菌群落组成往往保持动态平衡。然而影响这些平衡的因子到目前为止还不十分清楚。我们通过寻找已经报道的细菌素的相似蛋白序列,在人类微生物组的宏基因组数据中寻找可能的细菌素序列,一共预测到802个Ⅰ类细菌素,3048个Ⅱ类细菌素。一方面,不同的位点具有不同丰度的细菌素,而丰度最高的样品则来自于口腔,事实上大部分细菌素来自口腔样品。蛋白质相似性网络分析显示来自同一位点的细菌素聚集在一起,并且每个位点中,少数几个细菌素占主导。当我们关注预测到细菌素的参照基因组时,对于来自口腔样品中的细菌素,绝大部分大部分来自口腔优势菌葡萄球菌(Streptococcus)。对于其它位点,情况类似,细菌素所对应的参照基因组主要来自各位点的优势菌群。我们认为细菌素在形成与维持各个位点的微生物群落过程中起主要作用。另一方面,与其它位点相比,来自肠道样品中的细菌素相对于宏基因组大小的相对比例明显少于其它位点,因此我们认为对于肠道微生物群落的动态分布,细菌素的作用可能不占主导。