论文部分内容阅读
规律成簇间隔的短回文重复序列Clustered regularly interspaced shortpalindromic repeats(CRISPR)是一类在原核生物基因组中广泛存在的DNA片段,通常包含若干个较短的回文DR(direct repeat, DR),DRs之间由称为spacer的DNA序列分隔。CRISPR-cas系统在原核生物免疫系统中起到重要功能,其作用方式类似于真核生物中的RNA干涉机制。Spacer通常与某种质粒或噬菌体的DNA片段具有序列相似性,在参与细菌免疫干扰时起识别靶序列的作用。从不同环境获取的微生物群落的CRISPRs的组成特异性很强,而CRISPR的组成变化可能在菌群结构建成和稳定等方面发挥作用。人体是十分复杂的生态环境且其共生微生物群落具有较高的多样性。当菌群结构发生失衡时人体就可能发生疾病。研究微生物群落CRISPR有助于深入理解人体菌群防御力与稳定程度,以及CRISPR对微环境保持健康状态的潜在作用。 我们以牙周炎为例,研究了菌群CRISPR组成变化与牙周健康/疾病之间的关联性。收集了18个人体口腔微生物样本,包括9个牙周炎病人和9个健康人的牙菌斑,采用HiSeq2000高通量测序仪进行双端DNA测序,共得到176,931,096条reads数据。我们从这些reads中识别出其中的CRISPR结构,并基于与已知数据库中序列的相似性,确定CRISPR的重复序列的所属菌种和spacer对应的噬菌体种类。共识别出844个DRs和24,841个spacer,长度集中在30-40bp之间。主成分分析结果表明,健康人和牙周炎病人可以根据DRs和spacer的组成区分开,说明健康人与牙周炎病人口腔菌群的CRISPR在组成上差异显著。DRs在牙周炎病人口腔菌群中的多样性明显高于健康人,但spacer则在健康人的口腔菌群中具有更高的多样性。健康人中超过一半的spacer的丰度显著高于牙周炎病人,许多种类的spacer在健康人中存在,但在牙周炎病人中不存在或者丰度极低。与此同时,无论DRs或者spacer,健康人样本间CRISPRs组成差异均小于牙周炎病人,即健康人样本之间更为相似,而病人样本之间差异很大。进一步的分析显示,构成口腔微生物群落DRs防御的主体来源于Corynebacterium、 Actinobacillus和Capnocytophaga等细菌,而通常在口腔菌群中丰度最高的Streptococus、Prevotella和Actinomyces等细菌并非最大的贡献者,提示人体口腔菌群的CRISPRs组成不仅与物种丰度,且与物种种类有关。在spacer所归属的444种噬菌体中,96种噬菌体对应的spacer在牙周炎病人口腔菌群中,相对丰度的方差显著大于健康人,其中差异最显著的三个噬菌体属为Enterococcus phage,Lactobacillus phage和Burkholderia phage。这些结果表明当遇到更多种类的噬菌体侵袭时,健康人菌群的CRISPR因为拥有更多的spacer并且组成趋于稳定,使得他们拥有更广泛的噬菌体防御范围,稳健性更强,也更有利于维护口腔菌群处于健康状态。 为了研究CRISPR在特殊人体微生物(特别是重要的病原微生物)中的进化,我们选取了SRP036051以及PRJEB7281两个数据集进行分析。SRP036051数据集收录了来源于不同国家和大陆的跨越1969年到2013年的3615个来自Streptococcus pyogenes的菌株测序序列。经过SOAPdenovo拼接并利用CRISPRRecognition Tool(CRT)识别基因组中的CRISPR结构。通过确定cas蛋白的位置来确定CRISPRs的方向,全基因组比对并构建进化树。经过分析发现,这个物种主要有2套CRISPR系统,其中CRISPR1一共只出现8种spacer,绝大多数是由4个spacer组成的一个组合;CRISPR2出现过36种spacer,组合很多。这说明在这个菌种中,存在两套防御范围不同的CRISPR。CRISPR1比较保守,含有的4个spacer组成的这个组合,可能对于这个菌种生存至关重要,而CRISPR2则含有更多的组合以适应外界的变化。我们在年代更替中发现了新出现的spacer会在最左端插入,旧的spacer会在右端末端丢失的现象,这符合以往对于CRISPR的研究。但是在CRISPR2中出现了spacer从内部丢失的现象。在数据集PRJEB7281(Mycobacerium tuberculosis结核分枝杆菌)中同样出现了CRISPR从内部丢失的现象。这些重要病原微生物种类的CRISPR组成和变化在人体微生物组中的变化及其与人体健康之间的关系尚不清楚,有待于进一步研究。