论文部分内容阅读
肺炎克雷伯菌是一种短棒状的、无运动性的革兰氏阴性菌,由Friediander于1893年从患大叶性肺炎病人的肺组织中首次分离得到,它是一种条件致病菌,易在住院患者的呼吸道和肠道中定植,通常会导致肺炎、脑膜炎、肝脓肿、眼内炎、泌尿系统发炎、伤口感染、全身败血症等疾病的发生,给临床治疗带来了很大困难。特别是近年来,由于多重耐药性肺炎克雷伯菌的不断传播,肺炎克雷伯菌感染的治疗也变得更加困难,因而人们对于肺炎克雷伯菌的关注也越来越多。另一方面,肺炎克雷伯菌在工业上可用于发酵甘油生产1,3-丙二醇、2,3-丁二醇等重要的平台化合物,而且由于其高产量和生产力,肺炎克雷伯菌已被认为是所有野生菌中最有前景的1,3-丙二醇工业生产菌株。肺炎克雷伯菌是一类多谱系、多系统发育起源的细菌,但目前有关其系统发育以及其与致病性之间的关联还在解析之中,也是目前研究的一个热点。随着二代高通量测序技术的发展,已测序的肺炎克雷伯菌基因组的数量迅速增长,这就为利用基因组大数据来分析肺炎克雷伯菌的系统发育成为可能,从而更为全面地分析肺炎克雷伯菌各谱系之间的进化关系。然而,现有的几种系统发育分析方法都不能满足这种大数据分析的需要,因此迫切需要建立一种可靠、精确的系统发育分析方法来获得基于基因组大数据的肺炎克雷伯菌的系统发育关系。本文基于肺炎克雷伯菌核心基因的组成与特征分析,建立了一种新的系统发育分析方法,并与现有方法比较,验证了其可靠性与精确性,并利用该方法对肺炎克雷伯菌的基因组大数据进行系统发育分析,主要的研究结果如下:(1),本文通过对84个肺炎克雷伯菌基因组进行多序列比对,确定了肺炎克雷伯菌的核心基因组的大小为3.0Mbp左右,核心基因的数量为2735个。对所得核心基因组成的分析发现大部分核心基因都为内源基因,只有少部分为外源基因,同样,绝大多数核心基因都较为保守,进化速率较低,且绝大多数核心基因的长度在500bp到1500bp之间,只有很少的一部分核心基因属于致病基因。(2),本文在核心基因及核心基因组SNPs分析的基础上,分别选用50个核心基因,建立了4种新的系统发育分析方法,分别为:随机选择法、GC含量偏移率选择法、突变率选择法以及综合选择法。(3),本文以32个全基因组水平序列为样本组,比较、分析了基于新建方法所得的进化树。发现:基于随机选择法、GC含量偏移率选择法和突变率选择法所得的进化树都没有现有的基于SNPs矩阵所获得的进化树准确,这表明上述几种方法的分辨率不足,都不适用于后续的系统发育分析;而综合选择法所得的进化树要比基于SNPs矩阵所得的进化树更为准确,其进化树本身也有着相当高的置信度,因此本文提出的综合选择法是一种较现有方法更可靠准确的系统发育分析方法。(4),本文证实了综合选择法不但准确、可靠,而且是一种简便易行、适用于大数据的系统发育分析方法,并用它成功实现了950个肺炎克雷伯菌基因组的系统发育分析;另外,综合选择法也被证实适用于克雷伯氏菌属的种间分析,通过引入了克雷伯氏菌属的其他种和亚种的标准菌株,成功鉴定了所得进化树中几个非肺炎克雷伯菌分枝的分类学归属。(5),本文通过基因组大数据分析,进一步证实了肺炎克雷伯菌除CG258外的各个谱系是独立进化的,还证明了ST395菌株不但属于CG258而且可能起源于ST11菌株,而且ST11菌株还很有可能是CG258的共同祖先。另外,研究还发现了3个CG258的新成员(ST340、ST437和ST855)。(6)本文在基因组大数据的基础上,探讨了肺炎克雷伯菌的流行病学,发现:ST258这一谱系是肺炎克雷伯菌中传播最快、分布最广的一个谱系,而强致病性菌株的各个谱系的传播速度则相对较慢,而且这些谱系的进化过程以及肺炎克雷伯菌致病性的进化都是相对独立的。