论文部分内容阅读
遗传图(geneticmap),又称连锁图(linkagemap),它是以具有遗传多态性的遗传标记为“路标”,以基因座之间的重组率(1%的重组率称1cM)为“图距”的基因组图。遗传图可用于筛选性状关联基因,比较相关物种之间的基因组结构,作为框架结构辅助基因组拼接。飞蝗是一种在全世界广泛分布的农业害虫,从古至今经常爆发,长期危害农业生产发展和人民生活。然而科技发展至今,蝗灾并未得到很好的控制,其中一个重要的原因是飞蝗分子生物学方面的研究并不很深入,因此覆盖全染色体的遗传图谱是非常有必要的。但由于飞蝗的基因组巨大(7.3Gb),所以采用传统遗传图谱构建方法不可行。而限制性酶位点关联的DNA序列测序技术(RADSeq)作为一种与新一代测序技术相结合的方法,具有高通量、快速、低价、便于分析等优点,被广泛运用于遗传图谱的构建、谱系生物地理学和种群生态学的研究,及非模式生物的基因组测序等。因此本实验采用RAD测序法构建了飞蝗遗传图谱。 我们选取了实验室种群和海南种群作为亲本。为了测试RAD所检测的SNP位点数量足够用来构建遗传图谱,首先对两个亲本进行深度RAD测序(20X),最终得到3.7G和2.8G的数据量,分别有77%和83%的reads能比对到基因组上,比对到唯一一个位置的reads占总reads个数分别为37.39%和42.79%,只采用在全基因组唯一比对到一个位置的reads做后面的分析。最终有>5Gb的基因组序列上有snp位点。这说明RAD的方法和我们选择的种群是合适的。我们采用两个自然地理种群的杂交后代,106个体,作为作图群体。snp位点鉴定采用samtools-0.1.9pileup方法进行,总共发现了386,677个SNPs位点(丢失率<40%)。经过分离实验过滤后,有69,506个位点可以使用,覆盖了4,442,119,499bp的范围。对所有子代的个体,我们根据标记序列,把每个个体的reads分选出来。再进行纠错之后,我们获得了232,308个位点。按照孟德尔遗传规律,可以把这些位点分为父本1:1(127918),母本1:1(73105),1:2:1(29996)以及1:1:1:1(1289)。计算了LOD值和重组率之后,我们设LOD的阈值为8,根据LOD值把marker位点进行聚类,最终具有100个marker以上的连锁群有11个,这和蝗虫的染色体条数是一致的。在这最终建成的遗传图谱中,有15890个分子标记用于作图,相应的scaffold长度为2,785,919,512,相当于5.704个/Mb的密度。连锁群的分子标记数在178-2263个之间,标记的密度则介于4.853个/Mb-8.611个/Mb。我们最后对RAD测序法作了实验室的验证。利用Sanger测序法对随即选择的110个SNPs位点进行扩增测序后,将其与RAD法的结果对比,最终有78%的位点是相符合的。 我们的遗传图谱首次覆盖了飞蝗这种最重要的农业害虫的全染色体,也是首次在如此大的昆虫基因组中构建遗传图谱。利用RAD测序法筛选出了386,677个SNPs位点,最终使用了15890个分子标记,这也大大超过了之前的其他遗传图。使用Sanger法验证,有78%的符合率,这说明RAD测序法构建飞蝗遗传图谱在技术上是可靠的,我们构建的遗传图谱也较为可信。但是最终分子标记的密度为5.704个/Mb,且覆盖率也不高,这是因为蝗虫的基因组巨大,且具有较高比例的重复序列。