论文部分内容阅读
DNA芯片是现代生物技术中重要的前沿技术之一。本论文从芯片的制备、探针设计、待测DNA模板制备和检测方式等多种角度,提出一系列创新性方法,设计出新型的高通量DNA检测微阵列芯片,并利用这些芯片开展了SNP检测、肿瘤样本的DNA甲基化研究、小量样品的基因表达高精度平行性检测以及对转录因子在全基因组范围内的结合位点的鉴定。具体研究内容和成果如下:
1、基于多聚丙烯酸修饰表面的PCR产物芯片及其在多样本SNP检测中的应用
本研究中采用多聚丙烯酸包被技术来改进基于平面玻片的PCR产物的固定效率。在本方法中,用氨基修饰的引物扩增待测的DNA片段,PCR产物经过简单的乙醇沉淀后,通过机械手点样到多聚丙烯酸包被的玻片上制备成PCR产物微阵列。通过与醛基包被表面比较,证实了多聚丙烯酸包被的表面具有很高的核酸固定能力,并且发现固定的PCR产物对沸水浴处理和NaOH处理均具有较高的稳定性。应用基于多聚丙烯酸表面的PCR产物芯片,分别用杂交、固相单碱基延伸和固相多碱基延伸三种方法检测了单核苷酸变化。我们用这种方法成功地对30个健康成年人外周血DNA样品中Cytochrome P450 2D6基因的4个SNP位点进行了分型。实验结果表明,这种多聚丙烯酸包被的玻片对于粗制PCR产物可以获得高的固定效率,能够实现高特异性和高信噪比的SNP分型,并且具有杂交效率高、背景荧光低和极少吸附荧光标记探针以及能有效地进行酶延伸反应等优点。
2、结合靶选择锁式探针(TSPP)通过芯片上单碱基延伸进行多重CpG甲基化检测
本研究运用一套靶序列选择锁式探针(TSPP)实现了多个靶基因的并行性扩增,采用多聚丙烯酸包被的玻片来制备甲基化分析芯片。TSPP探针通过其3’-和5’-末端的特异性序列与亚硫酸氢盐处理后的基因组DNA上的特定靶序列杂交,并在3’-和5’-末端之间留出一段未杂交的30-100个碱基的靶序列,这段靶序列中含有多个待检测的CpG位点。TSPP探针和亚硫酸氢盐处理的基因组DNA杂交后,以这段未杂交的靶序列为模板,在DNA聚合酶的作用下延伸TSPP探针的3’-末端。当TSPP探针的3’-末端延伸至探针的5’-末端时,在DNA连接酶的作用下填补缺口形成单链DNA环,然后用一对通用引物扩增成环的TSPP探针从而实现了对多个靶基因区域的并行性扩增。为了准确地检测多个靶位点的DNA甲基化,将扩增产物和多聚丙烯酸修饰玻片上固定的寡核苷酸探针杂交,并用荧光标记的底物Cy3-dCTP和Cy5-dUTP进行固相的单碱基延伸(SBE)。利用多聚丙烯酸修饰表面荧光背景低、DNA固定效率及杂交效率高的特点,提高了DNA甲基化芯片检测的灵敏度和准确性。实验结果表明,本方法能够实现对多个目标序列的并行性扩增和对目标序列中多个CpG位点甲基化的准确检测。
3、利用乳液PCR和随机微球微阵列技术进行基因表达的数字化定量
在本研究中我们将mRNA介导的连接、微乳液PCR和随机微球微阵列等技术相结合发展了一种随机高密度微阵列技术,用于单分子水平的mRNA定量分析方法(MLB)。这种微阵列是将上百万个由表面具有由单个靶分子扩增而来的分子簇的微球固定到玻片表面制备而成。在靶基因的mRNA介导下应用DNA连接酶把若干与各个靶基因mRNA互补的寡核苷酸探针对进行连接,然后该连接产物在油-水微乳液中被扩增到2.8微米磁性微球的表面。扩增过的微球被固定在载玻片上形成高密度的随机微球微阵列。通过使用荧光标记的探针对每个微球上的扩增产物进行解码,并对每种已解码的微球进行计数,即可得出相应基因的表达水平。我们比较和优化了微乳液PCR的反应配比、反应条件,并比较了不同微球的乳液PCR反应,以及在玻片表面上的不同固定方法。用这种高密度的随机微阵列实现了对小量样本的基因表达的数字化检测。应用该技术我们检测了人类白血病K562细胞在用PMA(phorbol 12-myristate 13- acetate)诱导向巨核细胞分化前后Klf4、Sox5和Gapdh基因的表达水平。我们发现在PMA处理的K562细胞KLF4的表达有明显的上调;而与此相反,在PMA处理下Sox5的表达显著下调,并被real-time RT-PCR所证实。该研究表明该技术能够提供准确的表达分析,是一种具有高通量潜力的表达分析方法。
4、用ChIP-Seq在全基因组范围鉴定转录因子的结合位点
染色质免疫共沉淀(ChIP)技术是能够研究DNA-蛋白质在活细胞状态下结合情况的一种非常有用的技术。在本研究里,我们建立了ChIP-Seq技术平台并成功地鉴定了转录因子EGR1在基因组范围内的结合位点。
在ChIP实验的初步优化方面,我们对ChIP技术进行条件摸索和优化以获得高度特异的捕获产物,为高通量测序提供高质量模板。由于真核生物基因组非常复杂,细胞内有各种各样的蛋白质,目标蛋白的特异性捕获成为ChIP实验的关键。为了提高ChIP的特异性,我们用了2个不同的转录因子抗体(EGR1和STAT3)对ChIP的步骤及参数进行实验优化。实验中我们用这两个转录因子的已知靶点作为正对照,比较了不同的捕获磁珠,洗涤条件以及捕获时间对富集特异性的影响。同时我们也优化了片段化染色质时超声的条件和ChjP DNA纯化方法,获得了高度特异性的ChIP产物。
在SOLiD测序文库的制备方面,标准的SOLiD文库需要大量的DNA样品(500ng-2μg)和多个步骤,而ChIP的产物的量通常是非常有限的(0.1-30ng),因此需要对测序文库的的制备进行优化。我们对各种步骤进行了优化,简化了整个过程步骤,提高了DNA的收率,大大地减少了文库所需的DNA量。
检测K562细胞系(白血病)的表达谱了解研究的转录因子在特定细胞状态的表达以及其靶基因或控制目标转录因的基因表达状态是非常重要的。白血病细胞系对于阐明控制系限定的造血细胞的分子机制是非常有价值。人类白血病细胞系——K562细胞是一个红系白血病细胞系(erythroleukemia cell line),它是巨核细胞(megakaryocytic cell)和红系细胞(erythroid)的共同前体,它的分化被阻断。在PMA处理下,K562细胞能够被诱导成巨核细胞,因此该细胞可以提供一个研究转录调控的模式。在细胞分化过程中,转录因子的激活或抑制对于造血细胞的发育起着重要的调控功能。由PMA诱导的EGR1基因表达的激活在多种细胞类型被观察到。已有的研究表明EGR1的激活对于K562细胞向巨核细胞分化是重要的。为了进一步理解PMA诱导的K562细胞的分化的转录调节机制,我们也分析了K562细胞处理PMA前后的基因表达的变化。结果表明有4428个基因的表达发生了变化(大于2倍),其中2796个基因被上调,1632个基因被下调。这些差异表达的基因涉及到广泛的分子功能。我们发现在PMA处理下,大部分已知的EGR1靶基因的表达发生了显著的变化。我们也对那些差异表达的转录因子进行了分析,发现许多调节造血发生的转录因子的表达发生了变化。我们的表达数据对全面理解白血病细胞的分子特征及造血细胞的分化的分子机制和网络调控提供了重要的基础。
用ChIP-sequencing在全基因组范围鉴定EGR1的结合位点EGR1是一个早期反应因子,广泛参与了各种细胞反应。以前的研究表明EGR1在PMA诱导的K562细胞向巨核细胞的分化过程中起重要的作用。但是它的作用分子机制还没有广泛研究。我们用染色体免疫共沉淀技术和高通量测序平台在基因组范围鉴定了的EGR1结合DNA序列。我们得到了3.67M的可以唯一匹配到基因组的序列。我们用CisGonome软件分析了数据,得到了14667个EGR1结合的富集峰。为了评估ChIP-Seq数据的可信度,我们随机挑选了28个峰进行ChIP-PCR验证,发现89%的峰是结合有EGR1。对32个已知的EGR1靶基因以及ChIP-chip数据进行检查,发现60%已知的靶基因和61%的ChIP-chip鉴定的靶点可以在我们的ChIP-Seq数据里发现。用所得到的富集峰里的序列,通过计算得到的Motif和已报道的高度一致。这14636个富集峰中,其中有71%的结合位点可以定位到6138个已有注释的基因区及其扩展的区域(转录起始上游(TSS) 10kb-转录终止点下游(TSE) 10kb)。对富集峰定位发现37%EGR1的结合区域位于于内含子区和17%位于TSS 2kb-TSS 200bp的启动子区。对这6000多个靶基因进行分子功能分类表明EGR1的靶基因涉及广泛的分子功能,其中靶基因数目最多的一类是转录因子(695个)。另外,ChIP-Seq的结果也揭示有79个microRNA的启动子区域也有EGR1的结合。EGR1结合于大量的这些转录调控因子暗示着EGR1在PMA诱导的K562细胞分化过程中起到了重要的调控作用。我们还比较了PMA处理的K562细胞中EGR1结合基因的表达变化。发现在PMA处理下920个EGR1的靶基因上调的和243个靶基因下调。特别值得注意的是在差异表达的EGR1的靶基因中有130个是转录因子。我们的研究揭示在PMA诱导的K562细胞分化过程中EGR1及众多的EGR1的靶基因的表达发生了变化,说明EGR1是这一过程的关键因子。我们的研究鉴定出上千个新的EGR1靶点,这种全基因组范围的EGR1结合位点的鉴定为了解EGR1作用机制和造血细胞的分化的分子机制提供了新的线索。