论文部分内容阅读
微生物次级代谢(secondary metabolism)是当微生物的生长到达一定的生长时期(一般是稳定期),就会利用初级代谢产物作为前体,经过一系列聚合、装配等代谢过程,合成一些对自身生命活动没有明确功能的物质,即次级代谢产物。许多微生物的次级代谢产物具有抗真菌、抗细菌、抗肿瘤等生物活性,是微生物药物开发和新药创制的重要来源。目前,放线菌、黏细菌等是细菌次级代谢调控和天然产物发掘的重要研究对象。但是,目前对于细菌能合成多少种次级代谢产物、不同类群的细菌在合成次级代谢产物能力的差异、以及次级代谢产物生物合成基因簇(以下简称次级代谢基因簇)是如何进化等问题,尚缺乏系统的研究。本论文拟利用公共数据库中的基因组信息,对细菌界的次级代谢开展比较基因组学研究,研究不同类群细菌次级代谢能力的异同,揭示次级代谢基因簇的进化规律。本论文从NCBI基因组数据库中,挑选了635个细菌菌株的基因组(>=4Mb)进行分析,这些菌株分属于5个门,分别为放线菌门(122个菌株)、拟杆菌门(52个菌株)、蓝藻门(39个菌株)、厚壁菌门(89个菌株)和变形菌门(333个菌株),其中变形菌门进一步分为4个纲,分别为α-变形菌纲(90个菌株)、β-变形菌纲(80个菌株)、γ-变形菌纲(131个菌株)和6-变形菌纲(32个菌株)。利用antiSMASH服务器注释次级代谢基因簇,共注释出40类次级代谢产物的合成基因簇,其中非核糖体多肽类、Ⅰ型聚酮类、细菌素、萜烯类等四类次级代谢产物的生物合成基因簇,分布于几乎所有门/纲中。多类次级代谢产物的生物合成基因簇主要分布于两个或以上的门/纲,分别为芳香基多烯类、高丝氨酸内酯类、羊毛硫肽类、lassopeptide、Ⅲ型聚酮类、其他聚酮类和铁载体。其他类型的次级代谢基因簇主要集中分布于某一个门/纲。对基因簇长度的分析发现,多数类型基因簇在不同类群中的长度比较接近。总体上,含有的次级代谢基因簇的总长度与基因组大小之间有一定的相关性,基因组越大,含有的次级代谢基因簇越长。其中,δ-变形菌纲的Sorangium cellulosum So0157-2的基因组最大,为14.78 Mb,含有的次级代谢基因簇长度为1.48 Mb;放线菌门的Streptomyces bingchenggensis BCW-1的基因组含有的次级代谢基因簇最长,为2.77 Mb,对应基因组大小为11.94 Mb。相关性在不同类群之间也存在明显差异,其中放线菌门(R2=0.62, p-value<2.2e-16)和δ-变形菌纲(R2=0.74, p-value=1.07e-10)的相关性最好,其他类群相关性很低(R2<0.3),以γ-变形菌纲最低(R2=0.017, p-value=0.13)。多数质粒上不含次级代谢基因簇,但在部分细菌中(如α-变形菌纲的Azospirillum brasilense Az39),质粒对基因组中次级代谢基因簇的贡献高达~50%。为了揭示次级代谢基因簇的进化关系,构建了同源基因家族。基于是否含有同源基因,将同一类型的基因簇,分为多个不同的组。选取最大的组作为代表,研究组内的基因簇在不同类群中的分布和结构的异同。比较分析发现,对于多数类型的次级代谢产物,同一组的基因簇分布于不同的门/纲中,说明基因簇的保守性高;部分基因簇中含有类群特异(如门特异或纲特异)的保守基因。从基因簇结构上讲,同属的基因簇结构相似性高,而不同属的基因簇,结构差异较大。进一步以海洋特有细菌属——假交替单胞菌属为研究对象,研究了海洋细菌的次级代谢。系统注释了该属26个种模式菌株基因组中的次级代谢基因簇。研究发现,不同类群/进化分支次级代谢能力差别很大,不产色素类群/分支菌株每个基因组含有的次级代谢基因簇总长很短,平均仅为0.04 Mb,而在产色素类群/分支菌株基因组中,平均长度高达0.45 Mb。两个类群/分支基因组中均含有细菌素合成基因簇,不产色素类群/分支还含有铁载体合成基因簇,而产色素类群/分支菌株基因组中则含有大量的NRPS/PKS等合成基因簇。上述差异与两个类群/分支的生理特点和生态分布相一致。分析发现,产色素类群/分支假交替单胞菌是γ-变形菌纲中含有次级代谢基因簇最多的类群之一。综上,本论文在全基因组水平上对细菌的次级代谢进行了系统的注释和比较研究,揭示了细菌次级代谢的多样性和合成基因簇进化上的保守性,对海洋特有细菌属——假交替单胞菌属进行了详细分析,揭示了次级代谢与细菌进化和生态适应之间的相关性。本论文研究结果从全局水平上揭示了细菌次级代谢能力和进化特点,对新型天然产物的发现也具有指导作用。