论文部分内容阅读
原核生物中的CRISPR-Cas系统是一种可遗传的适应性免疫系统,在适应过程中它能够“特异”地从外源遗传因子上截取DNA片段(protospacer),并将它作为新的spacer“特异”地整合到CRISPR结构中,由此转录加工产生的CRISPR RNA(crRNA)可以指导Cas蛋白识别并降解外源遗传因子。自从2007年Barrangou等人首次观察到适应现象后,很长时间科学家们都难以观察到CRISPR对单一遗传因子的高效适应现象,这严重阻碍了适应机制的研究。我们的前期工作利用Haloarcula hispanica的I-B型CRISPR系统和新分离的嗜盐病毒HHPV-2观察到了高效的适应现象,并通过大量遗传学实验揭示了该过程中引发(priming)机制的必要性,从而提出了引发机制介导CRISPR从外源DNA上特异性选取protospacer的重要见解。本论文在此基础上构建了一个引发-整合分离的适应系统,通过大量的序列突变实验对leader及其下游repeat的关键元件进行了解析,结合病毒HHPV-2的侵染揭示了repeat序列中的保守motif在spacer特异性整合过程中的重要作用。 spacer整合反应特异地发生于leader下游的repeat序列两端,分别称为“近leader端”整合位点和“远leader端”整合位点。我们的研究表明,保守的leader-repeat junction在适应过程中提供了一个固定的“近leader端”整合位点,但该位点可能并非仅仅通过序列依赖的方式进行识别。相应地,我们在该整合位点下游约10bp处鉴定到了一个重要的AACCC motif,该序列的突变或者与“近leader端”整合位点间距的改变,都会明显抑制甚至阻断spacer整合过程,这暗示该motif可能辅助了“近leader端”整合位点的识别。有意思的是,我们在repeat序列内部还鉴定到了另一个重要的GTGGG motif,它的突变明显抑制了spacer整合过程,而且“远leader端”的整合反应严格地发生于GTGGG中心的下游10bp处,说明该序列可能为“远leader端”整合位点的识别提供了一个分子尺(molecular ruler)的锚点。通过改变两个motif的间距我们首次实现了对CRISPR结构“周期性”(重复序列的长度)的改造。基于上述结果,我们认为repeat序列内部的保守motif参与了repeat序列两端整合位点的识别。值得注意的是,我们在leader的远离repeat端区域发现了一段保守的回文序列,它的突变会阻断spacer整合过程,该现象在其他CRISPR系统中尚未见报道,暗示了I-B型系统的适应过程存在一些特殊的分子机制,有待进一步研究。 此外,我们还对病毒HHPV-2的复制过程进行了探索,发现了一些有意思的结果。例如,我们发现在病毒感染后期其ORF8的部分序列会发生重复(duplication),该现象尚未见过报道;其次,在一定的条件下,HHPV-2在胞内会发生自我重组衍生出一个小质粒pHHPV-2。对于这些现象背后隐藏的分子机制或生理功能有待于我们深入研究。 综上所述,我们基于极端嗜盐古菌I-B型CRISPR-Cas系统,构建了引发-整合分离的适应检测体系,并对适应过程的第二阶段——新spacer的特异性整合进行了机制探索,首次阐述了repeat序列中保守的motif对于其两端(近leader端和远leader端)整合位点识别的重要性,为CRISPR spacer的特异性整合机制提供了一个新的见解。