论文部分内容阅读
链霉菌是一类高G+C含量革兰氏阳性细菌,其具有复杂的发育及形态分化过程、严谨复杂的基因调控网络、强大的分泌体系,并能生产大量次级代谢产物,是生产抗生素的最重要菌种。链霉菌基因组由一条庞大的线性染色体组成,部分链霉菌还含有一个或多个线性或者环状质粒,目前已经有40多个链霉菌基因组测序完成或即将完成。
本论文通过对5个模式链霉菌的比较基因组学分析,揭示其泛基因组含有17,362个同源基因家族,包括3,096个核心基因组基因家族,5,066个非必需基因组基因家族和9,200个物种专一的基因家族或基因。核心基因组主要包含链霉菌生命活动必需的基因,是研究链霉菌最小基因组的重要依据。其组分占各链霉菌全基因组蛋白的33-45%,其中包括50个功能未知的链霉菌标志蛋白。另外,大量的谱系特异性扩增基因家族,占5个链霉菌全基因组的4-11%,表明基因倍增及水平基因转移事件在链霉菌基因组系统进化过程中发挥重要作用。谱系特异性扩增存在物种专一性扩增及特定物种扩增两种分布方式;单一基因扩增和基因串区段扩增这两种谱系特异性扩增模式代表着不同规模的基因扩增方式。解析谱系特异性扩增基因家族的扩增机制及其功能,有助于深入理解链霉菌物种的特异性进化机制。
采用保守结构域分析方法对11个已测序的链霉菌基因组中sigma因子进行鉴定,结果表明分别含有35-65个sigma因子,占各基因组基因总数的0.52-0.72%,其中68.6-83.1%为第四类ECF sigma因子,这些ECF sigma,因子参与调控链霉菌应对环境胁迫的过程。对sigma因子进行同源分类,鉴定出22个保守的sigma基因,并对各类sigma因子进行系统发育分析。利用蛋白相互作用数据库分析3个链霉菌sigma的调控,各个sigma因子涉及的互作蛋白数为42-263个,而整个调控网络分别涉及各基因组中3,234,2,042和1,780个蛋白,并发现同源的sigma因子具有着相似的互作网络。对sigma因子蛋白互作网络的系统分析,有助于深入解析链霉菌基因转录水平的调控网络。
利用转运蛋白分类数据库TCDB对11个已测序链霉菌的转运蛋白进行分类及鉴定,结果表明分别含有761-1258个转运蛋白,占各基因组蛋白总数的10.2-13.7%,包括7类转运蛋白,涉及171个转运蛋白家族。这些转运蛋白拥有0-24个跨膜区,其中有34.7-41.5%的转运蛋白不含跨膜结构,9.5-16.0%的转运蛋白拥有6个跨膜区,7.3-10.7%的转运蛋白含有12个跨膜区。庞大的转运蛋白体系控制着链霉菌营养物质的摄取与胞内外平衡、抗生素及胞外蛋白的分泌等重要的生命过程。链霉菌中含量最为丰富的转运蛋白家族为ABC转运蛋白超家族和MFS转运蛋白超家族,分别占转运蛋白总数的32.7-47.5%以及10.1-15.0%。这两个超家族转运蛋白参与了链霉菌营养物质摄取及物质分泌过程,尤其是次级代谢产物外排过程。对链霉菌转运蛋白功能的研究,有助于深入揭示链霉菌的分泌机制,为链霉菌高效分泌次级代谢产物提供依据。
链霉菌蛋白的转运分泌主要涉及Tat转运系统和Sec能转运系统。其中,Sec系统辅助蛋白SecDF起着促进蛋白分泌的作用。在链霉菌基因组中,secD/F同源基因分别以secD-secF分离形式和secDF融合形式存在。分子进化分析发现secDF基因是由链霉菌早期的水平基因转移获得的,而在进化过程中由于不受选择压力在部分链霉菌中丢失。对S.coelicololor中secD/F功能分析,发现secD-secF基因缺失导致Sec途径分泌效率降低,secDF基因缺失则没有表现出明显的变化:而在双缺失条件下,木聚糖酶A的分泌效率下降更为明显,表明在secD-secF基因缺失条件下,secDF基因表达量上调,部分回补了secD-secF基因功能。基因表达分析发现secD-secF基因在各生长阶段高效、稳定表达,而secDF基因表达量极低;两套基因在功能和表达上可能存在一定的关联,在其中一套基因缺失条件下,另外一套基因通过提高增加自身表达回补功能损失。上述研究表明,secD-secF基因是Sec途径重要的组分蛋白,而secDF基因的功能则出现明显的进化衰退。