论文部分内容阅读
背景大肠埃希菌是一类具有复杂基因组结构及致病机制的细菌,其可引起轻度腹泻、出血性腹泻、溶血性尿毒症、尿路感染等多种疾病,甚至致人死亡,给公众健康造成严重威胁。CRISPR广泛存在于细菌及古细菌中,具有高度遗传多态性并蕴含丰富的菌株变异进化信息,可作为阐明细菌种群进化及鉴别高毒力菌群的重要分型靶位。CRISPR分型技术在大肠埃希菌中的应用将对监测大肠埃希菌的流行及控制由该细菌所引起的疫情暴发具有重要意义。目的1构建基于CRISPR的大肠埃希菌分子分型指纹数据库,比较CRISPR分型、MLST及血清分型的分型能力。2建立CRISPR型别与血清型的对照表,并筛选能用于检测特定血清型的特异性间隔序列,从而评估CRISPR分型在预测大肠埃希菌血清型中的效果。3分析080血清型大肠埃希菌CRISPR的多态性,探究CRISPR分型在阐明O80大肠埃希菌种群进化中的价值。4建立基于CRISPR的O26血清型大肠埃希菌分型数据库,探究CRISPR型别与宿主、地理来源的关系,评估CRISPR分型在监测O26菌株全球传播中的价值。方法1应用insilicoPCR脚本提取CRISPR序列,采用weblog分析大肠埃希菌CRISPR重复序列突变规律,设计能匹配重复序列的模式字符串。应用python中“re”模块通过模式字符串识别重复序列,从而提取间隔序列。同时,利用python编程语言自行编写专门识别大肠埃希菌间隔序列及CRISPR分型的批量化分析流程。采用CRISPRstudio工具实现CRISPR序列的可视化分析。2使用R软件计算CRISPR分型、血清分型及MLST分型之间的调整兰德指数、调整Wallace指数及辛普森指数。3利用ABRicate脚本中EcOH数据库及在线工具SerotypeFinder获得菌株血清型信息,采用mlst脚本获得菌株MLST分型信息,通过ABRicate脚本中VFDB数据库、在线工具VirulenceFinder及本地BLAST获得菌株毒力基因信息。4应用CGE在线工具CSI Phylogeny 1.4提取O80菌株全基因组SNP信息。通过 PHASTER、ISfinder、BEDTOOLs、snippy 及 gubbins 相结合提取 O26 菌株核心基因组SNP信息。5利用MEGA及RAxML软件构建菌株系统发育进化树,采用Phyloviz软件构建最小生成树,应用iTOL对系统发育进化树进行美化修饰。结果1基于Enterobase数据库中39515株大肠埃希菌CRISPR分型数据库的构建从Enterobase数据库共收集39515株大肠埃希菌,其中共35787株细菌拥有可用的CRISPR序列信息。此35787株细菌的CRISPR分析显示,CRISPR1共发现6360个等位基因,CRISPR2.2共发现6067个等位基因,二者共形成10698个CTs,辛普森指数为0.949。2 CRISPR分型在预测血清型上的应用对35046株CRISPR分型、血清分型及MLST分型均可用的菌株数据集分析显示,CRISPR分型与血清分型之间的关联性最强,调整兰德指数为0.858;CRISPR分型对血清分型的预测能力最强,调整Wallace指数为0.991;CRISPR分型的区分能力最强,辛普森指数为0.947。基于此数据集,建立了包含8923个CRISPR/血清型关系对的对照表。利用建立的CRISPR/血清型对照表,能够对该数据集内99.11%的菌株血清型进行正确预测。同时,以85%作为血清型预测灵敏度及特异度的临界值,共筛选出71个能预测26种血清型的特异性间隔子。利用建立的对照表对268株中国动物源性大肠埃希菌进行血清型预测,结果显示,该方法能够准确预测该数据集内83.96%的菌株血清型,而特异间隔子对该数据集内特定血清型预测的灵敏度及特异度分别为90%及100%。同时,利用建立的对照表对310株丹麦人源性大肠埃希菌进行血清型预测发现,该数据集内89.68%的菌株血清型能被正确预测,而特异间隔子对特定血清型预测的灵敏度及特异度分别为100%及98.92%。3 CRISPR分型在阐明O80血清型大肠埃希菌进化上的应用81株O80血清型菌株收集于NCBI数据库。CRISPR分型显示,80株O80大肠埃希菌共形成21个不同的CRISPR型别,其辛普森指数为0.807。MLST、cas1基因的系统进化树及CRISPR组成均显示,相比较于其它流行的STEC血清型,O80大肠埃希菌形成了一个独特的进化分支。对O80:H2菌株分析显示,70株O80:H2菌株可形成12个CRISPR型别。其中,CT4212出现频率最高,为26次,分布于6个国家,其次为CT4211,出现23次,分布于4个国家。O80:H2菌株基于CRISPR的聚簇结果发现,该血清型菌株被划分为4个谱系(LⅠ、LⅡ、LⅢ、LⅣ)。CRISPR间隔子差异性分析显示,相比较于谱系LⅡ,谱系LI缺失CRISPR2.2中第2位的间隔子。此外,相比较于4株O80:H26及1株O80:H19菌株,O80:H2菌株缺失CRISPR1中的第5位间隔子。结合毒力基因谱、CRISPR分型及wgSNP分型结果提示谱系LⅡ可能由谱系LI进化而来,O80:H2菌株可能由O80:H26及O80:H19菌株进化而来。4 CRISPR分型在监测O26血清型大肠埃希菌流行中的应用1367株O26:H11血清型大肠埃希菌收集于Enterobase数据库。结果显示,1367株O26菌株共形成172个CRISPR型别,辛普森指数为0.861。基于CRISPR的聚簇分析显示,O26菌株可被划分为5个亚组(Ⅰa、Ⅰb、Ⅱa、Ⅱb及Ⅱc),该聚簇结果与质粒基因谱型、核心基因组分型结果相一致。同时,核心基因组分型显示,O26菌株中存在一个新克隆子,ST29C4,该克隆子中的优势质粒基因谱型为ehxA+/katP-/espP-/etpD-,属于CRISPR亚组Ia,且该克隆子中的12株细菌拥有肠外致病性相关的毒力基因tsh。CRISPR分型、毒力基因谱型及核心基因组SNP分型的联合分析显示,ST29C4可能是ST29C3向其他谱型(ST29C1-C2及ST21C1-C2)进化的中间环节。对O26菌株各CRISPR型别进一步分析发现,CT4及CT6不仅在全球而且在大多数国家均为第1或第2顺位优势型别。然而,在澳大利亚CT239为第1顺位优势型别,在英国CT213为第2顺位优势型别,在新西兰CT12为第2顺位优势型别。在2012年之后,CT6型别呈现增长趋势但CT4却呈现下降趋势。分析CRISPR型别与分离地区的关系时,发现20个型别呈现本地化流行趋势,其中CT139、CT246与CT243均在一个较长的时间段内在同一个国家被持续检出。CRISPR型别与宿主关系分析结果显示,35个型别能在不同国家或不同年代在同一宿主内被检出,可能具备宿主特异性。其中,CT213及CT218分别能在46株及18株人源性菌株中被检出。结论1基于Enterobase数据库中39515株大肠埃希菌,成功构建CRISPR分子分型数据库,并证实CRISPR分型对预测大肠埃希菌血清型具有潜在的应用价值。2 CRISPR分型可作为判断O80血清型大肠埃希菌种群进化的重要指示物。3 026血清型菌株中存在一个新克隆子ST29C4,该克隆子在CRISPR谱系上属于Ⅰa,且CRISPR分型可作为监测O26菌株全球流行的重要工具。