论文部分内容阅读
猪肉是我国居民最为重要的动物性蛋白来源之一,提升种猪质量、选育优秀种猪决定着养猪业可持续发展的潜力。从历史角度看,常规育种手段在种猪选育方面已取得巨大的成功,然而单一技术手段的“瓶颈效应”也日趋严重。近年来,基因组选择理论的提出和技术的应用弥补了传统选育手段的不足,尤其在早期选择以及低遗传力性状的预测准确性提升方面有明显的比较优势,越来越多的育种企业开始利用基因组选择育种技术来加快选育进展。然而当前的基因组选择还存在诸多限制因素,其中最关键的是预测准确性问题,这与不同的种群结构、有效群体大小、性状的遗传特性以及标记的密度密切相关。相比奶牛而言,猪的种群结构、品种多样性以及经济性状的特征都截然不同,仅仅加大参考群数量并不能从根本上解决问题,需要从标记密度、类型等不同的技术角度来提升基因组选择的准确性。基因组测序技术的发展为人们低成本获取全基因序列水平的标记奠定了基础。更高密度的标记可以获取几乎所有的连锁不平衡信息,甚至直接利用致因变异作为性状基因组育种值评估的信息,这为解决种群结构、复杂性状的遗传评估提供了可能。本研究从基因组测序角度出发,研究不同的测序策略产生的不同密度的标记在基因组选择中的应用效果。首先选择成本低廉的简化基因组测序(RAD-seq)手段,评估其对大白猪低遗传力性状选择准确性的提升效果,同时通过与现行SNP芯片技术进行比较,阐述简化基因组技术的应用价值;其次利用高密度的低深度重测序技术来进行基因组育种值评估;最后,利用全基因关联分析和精细定位手段解析初生重、体长等重要经济性状的遗传基础,并鉴定到多个重要候选基因,为鉴定致因变异在基因组选择中的应用奠定基础。具体结果如下:1.本研究利用RAD-seq对618头大白猪进行基因分型,个体平均测序量为580M,鉴定到79,725个高质量的SNP,群体中的平均检出率为88.1%,SNP之间的平均间隔为32.5kb。为了验证RAD-seq技术在基因组选择中的有效性,本研究将618头大白猪群体按近似4:1的比例划分为参考群和验证群,在验证群表型值未知时分别考察BLUP方法和两种基因组育种值预测方法:GBLUP和SS-GBLUP对验证群育种值预测的准确性和偏向性。结果表明GBLUP对验证群个体育种值预测的准确性从BLUP的0.109(TNB),0.067(NBA)和0.009(LW)分别提高至0.220、0.184和0.205,而SS-GBLUP的预测准确性与GBLUP几乎相同;此外,GBLUP和SS-GBLUP明显改善了育种值预测的偏向性。同时,通过对大效应位点鉴定与利用并与BLUP结果进行比较,发现预测准确性显著提升(14.1%-135.7%)。2.为了比较同一群体中不同分型方法对基因组育种值估计准确性的影响,本研究同时利用RAD-seq和60K SNP芯片对453头大白猪群体进行基因分型,个体平均测序量为1.4G。分析结果表明:利用RAD-seq获得了139,634个SNP,而60K SNP芯片分析中仅获得45,175个SNP;RAD-seq获得的SNP超过80%之间的平均间隔小于15kb,而SNP芯片相似间隔的不到20%。比较分析表明RAD-seq发现低频SNP(MAF<0.1)的可能性是SNP芯片的两倍。利用GBLUP方法对生长、繁殖、体尺、胴体等性状进行基因组育种值估计,结果表明除100kg校正日龄、100kg校正日增重外,其他性状的估计准确性在RAD-seq、SNP芯片以及两种方法的合并数据等不同处理间差异较小,如胴体性状方面的差异在16.5%以内,体尺性状的差异在20%以内,初生重性状的差异在18.5%以内。利用初生重性状精细定位获得的大效应位点进行MBLUP分析,准确性较其他处理提高42.3%-78.4%,无偏性接近于1。3.通过对1097头大白猪进行不同策略的低深度重测序分析,结果发现不同批次、不同深度之间错配率、比对率、实际深度以及覆盖度方面稳定性较好。从测序深度与基因组覆盖率的相关性看,0.5×时覆盖度约为35%,1×时约为60%,2×时约为80%。与10×的基因组测序数据相比,无论是1×还是2×的深度基因型分型准确性都超过99%。同时,将1×的数据与60K SNP芯片的数据进行比较,两者重合的位点数能达到67%,并且其余的位点都和1×的位点紧密连锁。这些结果显示1×的测序深度是成本考虑下最合适的选择。4.利用低深度重测序(1×)获得了15,506,511个SNPs,在1097头大白猪群体中开展基因组预测准确性评估,与常规BLUP相比,超高密度标记可以有效地提高窝产活仔数、初生窝重、窝产健仔数等性状的基因组预测准确性,提升范围为33.3%-128%;与抽取的60K SNP标记相比,各性状基因组预测准确性提升范围在10.5%-46.6%。5.利用RAD-seq和SNP芯片获得的合并标记信息对大白猪和长白猪初生重进行GWAS研究,鉴定到2个与猪初生重显著关联的区域,分别能解释6.36%和4.25%的表型变异;同时对RAD-seq和SNP芯片数据集分别做GWAS,结果表明第4号染色体上的区域对RAD-seq数据集有效,但对SNP芯片数据集无效;其中染色体1上的区域则相反。体长性状方面,利用RAD-seq获得的数据集鉴定到1个显著关联的区域,能解释3.69%的表型变异。分别对这些关联区域通过品种特异性的序列水平标记填充进行精细定位研究,将致因变异所在区域缩小到~100-880 kb的间隔,这些区域包含6个重要候选基因:SKOR2、SMAD2、VAV3、NTNG1、TWIST2和PER2,这些基因与生长发育、骨骼发育等重要生物学过程有关。RAD-seq和低深度测序在猪基因组选择中效果评估研究有助于推动基因组测序作为基因组育种的主要分型技术,减少对国外SNP芯片的依赖,同时逐步积累的海量全基因数据,为我国构建新的育种理论或假设奠定基础。