论文部分内容阅读
油菜是白菜和甘蓝杂交形成的异源四倍体物种,祖先种白菜和甘蓝基因组均发生过三倍化的过程。因此,油菜的基因组结构非常复杂,限制了其基因组学研究及分子辅助育种的进展。已经公布的欧洲冬性油菜品种Darmor-bzh参考基因组序列只覆盖了油菜基因组的79%,不能完全满足油菜重要农艺性状关联分析和图位克隆等研究的需求。因此,迫切需要一个高质量的油菜基因组序列;其中,一张高质量的物理图谱是获得高质量参考基因组序列的重要基础。因此我们构建了中双11号的BAC文库,将BAC进行混池,随后对BAC进行fingerprinting,根据BAC的fingerprint数据进行contig拼接,最后与遗传连锁图整合得到中双11号的物理图。 中双11号BAC文库共包括73,728个克隆,保存于192个384孔PCR板中。按每6个384孔板为一个单元,将该BAC文库分成32个单元。每一单元按3×2排列,将每行、每列所有BAC克隆分别混合,得到48个行和48个列BAC混合池(pool)。每个单元混合得到96个pool,整个文库总共得到3,072个pool。提取每个混合池的BAC质粒、 SacⅠ/MseⅠ组合酶切,酶切片段与带有barcode的接头连接、扩增。最后,从酶切片段SacⅠ和MseⅠ限制性位点进行双端测序,每端读长为150bp。总共得到3.89亿有效的双末端reads,其中0.23亿条reads(5.90%)是大肠杆菌和载体序列。 随后,在将tag分配到每个BAC克隆的去卷积的过程中,每对read以50bp×2,70bp×2,90bp×2和110bp×2四种长度截取生成tag。所有的tag数据分到3,072个pool中,将只在某一行和某一列的pool中共同存在的tag分配到行列交叉处的BAC克隆中,这种tag是contig拼接所需要的WGP tag,最后每个BAC中四种长度的tag的平均数分别为14.00,14.58,14.47和14.50。 将不同的tag长度和不同的FPC cutoff值(10-10和10-15)组合得到8种WGP结果。分析结果表明,在相同cutoff值的设定下,不同tag长度对应的WGP结果只有很小的差别;在相同的tag长度下,cutoff值降低,contig的数量变多,但contig的平均长度会变小。 为了使tag与基于NAM群体构建的遗传连锁图中90bp序列长度的遗传标记完全匹配并得到较连续的物理图,我们最终选择90bp×2的tag长度和cutoff=10-10的条件作为WGP物理图的参数。在90bp×2的tag长度下,106.7万tag被分配到了61,729(83.7%)个BAC克隆中。其中,44,903个BACs相互拼接生成了3,278个contigs,剩余16,826个BACs成为了singleton。Contig的平均长度为501kb,总长度为1,642Mb,是估计的油菜基因组大小的1.37倍。 最后,利用15个基于NAM群体构建的高密度遗传图谱,将2,487个contig定位到油菜的19个染色体上,计算得到contig总长度与估计的油菜基因组大小相等。本研究中构建的高质量物理图谱将有助于控制油菜重要农艺性状的基因/QTLs精细定位和图位克隆以及生物技术的应用,同时对加速油菜育种进程也具有重要意义。