论文部分内容阅读
长期以来,化学诱变一直被广泛应用于建立植物和动物的诱变群体。对诱变群体使用正向遗传学或反向遗传学的方法进行筛选,是育种和功能基因组学的重要手段。由于CELI限制性内切酶具有对碱基错配位点进行特异性切割的特点,因此被应用于多种筛选诱变群体中稀有突变体的传统反向遗传学方法中。虽然传统的突变体检测方法日趋成熟,但由于人们对突变体的需求日渐增多,使用传统方法获得突变体的金钱和时间成本仍然居高不下,使得人们尝试开发更加经济和高效的突变体检测技术。随着第二代测序技术的高速发展,通量高、成本低的测序技术已经得到普及。因此,使用第二代测序技术对突变群体的DNA进行直接测序成为检测诱变突变体的新途径。由于对整个群体进行全基因组测序的成本依然过高,人们开发了多个对目标片段进行富集并使用第二代测序进行检测的方法,如分子反向探针法,固相/液相分子杂交法等。然而,这些方法并不适用于对大群体的目标片段的富集、测序和筛选的工作。应用三维池的混合方式以及常规PCR的方法,可以对大群体的目标区域进行富集,但由于混合池中稀有突变的比例较低,真实突变不易与测序错误相区分,因此,常规PCR富集方法所得检测结果的准确性并不理想。 本研究将多重半巢式PCR的富集方法和第二代测序的建库过程相结合,在尽可能减少PCR扩增的循环数、降低人为引入的点突变的数量的基础上,高效、特异地同时富集多个目标片段,并同步完成第二代测序的建库过程。使用本方法对模拟混合池中真实突变频率的样本进行建库和富集,然后进行Illumina测序,对结果的分析表明,与已报道的测序错误频率相比,本方法得到的第二代测序数据中的测序错误频率显著降低,能够区分真实突变与测序错误。在此基础上,使用叠氮化钠建立了水稻中花11(Oryza sativa L.ssp.japonica)的诱变群体,并获得了M2代单株的6238份DNA样品。本研究使用其中的1024个单株的DNA样品建立了2个8×8×8的三维混合样品池,并应用本研究所建立的多重半巢式PCR的方法对它们的36个目标区域进行了富集,然后进行Illumina测序。在数据分析的过程中,为了准确区分真实突变和测序错误,本研究开发了分步过滤的数据分析方法,利用宽松的筛选参数,在保留绝大部分(95%)的真实突变样品数据的基础上,去除掉在第二代测序过程中产生的大部分测序错误;随后使用严格的筛选参数,在过滤后的数据中以“Students t检验”(Students t-test)的统计方法,去除掉由于特殊的序列上下文结构引起的个别位点的高频测序错误数据。使用这种方法,本研究在所筛选的36个目标片段的1024个水稻诱变个体中,得到了16个突变体,经由Sanger法测序验证,其中无假阳性位点。