论文部分内容阅读
广宿主自转移质粒(又简称“广宿主质粒”)是指至少能够在变形菌门(Proteobacteria)的两个亚群(例如β-,γ-Proteobacteria)之间互相转移并稳定传代的一类质粒。它们是一类重要的可移动遗传元件(mobile genetic elements,MGEs)。典型广宿主质粒的基因组结构是由“骨架基因”和“装配基因”组成的嵌合结构。其中保守的骨架基因控制着质粒的复制、调控及接合转移等功能;而装配基因则是指抗生素抗性基因、重金属抗性基因、毒力基因、有机污染物降解基因等。广宿主质粒在细菌基因组进化和适应特定环境压力过程中发挥着非常重要的作用。然而目前被分离并进行全测序的广宿主质粒尚不多(已发表的全基因组测序的广宿主质粒不足60个)。因此目前广宿主质粒的数据库信息仍十分缺乏,限制了对广宿主质粒生物学特性及其生态功能的进一步深入研究。因此,从环境样品中分离新的广宿主质粒并进行全基因组序列分析,仍是目前研究广宿主质粒最为重要的基本工作。 我国在广宿主自转移质粒研究领域还尚未开展相关工作,我们实验室在国内率先开展了广宿主质粒的分离和测序分析工作。在我们实验室的前期工作中,从沈抚污水灌区底泥、土壤和污水环境中,分离了6个广宿主质粒(pSFA231、pSFS12、pSFS26、pSFS52、pSFW53、pSFA157),并进行了抗生素抗性检测、宿主范围检测、质粒不相容性鉴定等分析。本研究在前期工作基础上,对所分离的6个广宿主质粒进行全基因组测序和生物信息学分析。采用Illumina Hiseq2000高通量测序平台对获得的6个广宿主质粒进行基因组扫描。应用SOAPdenovo和GapCloser两款软件对序列进行初步组装获得sacffolds。采用Glimmer3.0软件进行基因预测,预测基因的注释信息通过基因产物的氨基酸残基序列和nr数据库信息之间的(blastp)比对而获得。根据基因注释和参考质粒的序列信息对获得的scaffolds片段进行排序和初步拼接,采用SnapGene Viewer软件绘制质粒的全基因组图谱或骨架基因结构图谱。采用ClustalX、Mega6、Splits Tree等生物学软件研究同族质粒的遗传进化关系:一方面,基于骨架基因的表达产物构建系统进化树或进化网;另一方面,对质粒的功能模块(复制模块、接合转移模块、调控模块)和整个骨架基因区域的序列进行比较基因组学研究。 对涵盖质粒骨架基因的scaffolds片段的初步拼接结果表明,其中4个质粒(pSFS12、pSFS26、pSFS52、pSFW53)具有典型的IncP-1质粒骨架结构,1个质粒(pSFA231)与新定义的PromA质粒家族亲缘关系较近,另外1个质粒(pSFA157)不相容群未知。 质粒pSFA231缺失序列(Gap)较少,根据初步组装结果中的已知序列信息,采用Primer Premier5.0软件设计PCR扩增引物,扩增未知的缺失序列获得了质粒的全序列。质粒pSFA231是PromA质粒家族的第6个成员,也是从中国发现的第一个PromA质粒。根据复制起始蛋白RepA的氨基酸残基序列以及整个骨架基因结构DNA序列的进化分析结果,可将PromA质粒家族划分为2个亚类:PromA-α(pMRAD02, pSB102)和 PromA-β(pMOL98, pIPO2T, pSFA231,pTer331)。 新分离的质粒pSFS12、pSFS26、pSFS52、pSFW53属于IncP-1ε不相容群。由于装配基因sacffolds片段较多且缺失片段较大,无法判断其排列顺序,因此这4个IncP-1ε质粒没有进行全序列补测,但骨架基因较为完整。基于释放酶TraI和复制起始蛋白TrfA的进化网络分析可以将IncP-1ε质粒进一步划分为ε-Ⅰ和ε-Ⅱ两个分支。发现抗生素抗性基因和污染物代谢基因各自有喜好的插入位点,ε-Ⅰ分支成员的装配单元插入的热点区域为parA基因和traC基因之间,而ε-Ⅱ质粒的装配基因通常插入在trfA基因和klcA基因之间。 质粒pSFA157不能归属到已知的质粒不相容群,该质粒复制起始蛋白与已经报道的质粒pMBUI2和质粒pMATVIM-7同源性较高,但这两个质粒不相容群未知,这里我们将这3个质粒定义为一个新的不相容群,命名为PromB质粒。 本研究对于扩展广宿主质粒基因组数据库信息和深入研究广宿主质粒的遗传进化关系具有重要意义,同时也有助于我们更加深入地了解广宿主质装配基因的生物学功能。