论文部分内容阅读
虽然长链DNA的人工拼接已经建立了一些常规化的方法,但是其花费仍然居高不下,合成长度也受到限制。传统的长链DNA合成方法是以CPG合成的寡聚核苷酸为基础模块,在溶液中通过DNA连接酶或DNA聚合酶介导的方法组装成长链DNA。该方法通量低、成本高,其主要限制步骤是寡核苷酸的合成。随着寡核苷酸合成技术的发展,基于微阵列技术的并行化学合成方法可以提高寡核苷酸的合成通量、降低合成成本,但是也存在一些缺点,比如合成的寡核苷酸混合物具有复杂的背景序列,单种寡核苷酸的量极低,并且保真度不高。我们在这里采用一种基于微芯片的寡核苷酸化学合成平台,探索了长链DNA组装方法,试图建立一种比目前商业化DNA合成费用低得多的规模化长链DNA从头合成方法。我们建立的这种规模化长链DNA从头合成方法由六个部分构成,包括寡核苷酸设计、芯片合成、寡核苷酸亚库扩增、片段组装、基因全长融合以及基因簇组装。首先,我们在设计芯片合成的寡核苷酸序列时,引入了通用引物序列的概念,随后,通过寡核苷酸的选择性扩增来降低芯片合成背景序列的复杂性,并提高单种寡核苷酸的量,满足下游组装的需要。接着,我们在基于连接酶的组装过程和基于DNA聚合酶的组装过程中,对DNA组装条件进行优化。在每个关键步骤,探索了不同因素对DNA组装成功率和保真性的影响,最终确立了同时保证DNA产量和保真性的最佳组装条件。另外,我们引入了 MutS固定化纤维素柱(MICC)纠错系统,可以低成本、高效率地进行针对寡核苷酸和组装产物的错误移除,从而提供更高质量的DNA产物。基于该方法,我们利用芯片合成后未经纯化的893根寡核苷酸(75,618碱基),并行合成了 78根DNA片段(平均长度330碱基对),构成了包括可溶性甲烷氧化酶基因簇和埃博霉素A,B,C基因(共11条基因)的总长度达到21.0千碱基对的基因序列。按照标准的DNA从头合成流程,我们可以在2天内完成从芯片合成的寡核苷酸材料到>1 kb的基因序列的快速合成,并保证错误率低至每千碱基内含有0.65个错误,保真度高于利用商业化提供的CPG寡核苷酸组装得到的DNA。基因长度的DNA(~1.0千碱基对)的合成成本可以低至$0.015/碱基对,远低于市场上提供的基因DNA的价格。另外,我们通过酵母体内同源重组技术成功地一步构建了长达12 kb的甲烷氧化酶基因簇表达载体,并探索了可溶性甲烷氧化酶基因簇在大肠杆菌的异源表达。化学合成的寡核苷酸不仅可以用作长链DNA组装的基本模块,还可以直接以短链DNA的形式作为各种应用研究中的研究工具。传统的寡核苷酸合成方法,主要是基于可控孔度玻璃(Controlled Pore Glass,CPG)的化学合成方法,受到通量和成本限制,合成的寡核苷酸只能充当PCR或者定点突变的引物。但随着DNA化学合成技术的发展,尤其是芯片合成技术的发展,大量寡核苷酸序列可以在几厘米见方的芯片上并行合成,通量得到提升,成本也随之降低,可以直接应用到代谢工程改造、药物开发、基因组功能分析等方面。但是,由于在同张芯片并行合成成千到上万根不同的寡核苷酸,得到的寡核苷酸是一个复杂的混合物,其中单种寡核苷酸序列的量极低。因此芯片合成得到的寡核苷酸无法直接分离,只能以混合物的形式应用到DNA组装、混合文库构建等方面,限制了寡核苷酸的应用。为了使芯片合成的大量寡核苷酸可以以独立序列应用到更多方面,比如蛋白质优化(调控因子设计筛选)、药物开发、非编码RNA功能研究等,我们建立了一种规模化的单根寡核苷酸快速分离制备方法,该方法基于微流体芯片和聚丙烯酰胺凝胶电泳两个平台。首先,我们在设计寡核苷酸序列时,引入通用引物将寡核苷酸混合库分成一系列亚库,从而降低分离的复杂性;每个亚库含有5-11根长度不同的寡核苷酸,相邻长度的寡核苷酸相差至少4碱基,从而可以通过PAGE方法分辨并分离。在这里,我们通过芯片合成了 4,125根不同的寡核苷酸,分为489个寡核苷酸亚库,合成寡核苷酸总长度达394,199碱基,构成了包括绿色荧光蛋白、木糖异构酶、三种纤维素酶编码基因(共6,441碱基对),以及1,723种线虫和人来源的microRNA前体模板DNA(共261,705碱基对)。通过条件优化,以及MICC纠错系统的引入,我们可以在2天之内得到纳摩尔级的PAGE纯度的分离的双链寡核苷酸,合成产物的错误率从初始芯片寡核苷酸的每千碱基对含有21.1个错误降低到每千碱基对含有3.1个错误碱基,花费最低可降至$0.004/碱基,并且,随着单张芯片合成量的提高,成本可以进一步降低。综上所述,我们基于DNA微芯片建立了两套有意义的DNA合成方法,包括规模化从头合成长链DNA方法和规模化单根寡核苷酸快速分离制备方法。规模化长链DNA合成方法的建立对于降低目前DNA合成费用,推动长链DNA大规模合成的发展具有重要意义。另一方面,我们制备的单根寡核苷酸从通量、成本、产量和保真度方面都可以满足科研中对大量独立寡核苷酸序列的需求,在通量和成本方面优于目前商业化提供的单根寡核苷酸(>60碱基),极大地填补了单根寡核苷酸(>60碱基)高通量低成本合成这方面的空白。