论文部分内容阅读
全基因选择广泛地应用在复杂性状的畜禽育种中,肉牛经济性状全基因组估计结果决定着肉牛全基因组选择,这对于肉牛行业非常重要,有必要在肉牛中针对这些性状进行全基因组选择的育种值估计研究。首先,使用经BovineSNP770K Beadchip生物芯片进行基因分型的1217头中国西门塔尔肉牛群体研究背最长肌重和里脊重的全基因组估计育种值,研究的性状包括活重、胴体重、背最长肌重、里脊重、上脑重、外脊重、眼肌重以及腰背部肉重。使用随机分组策略构建训练集和验证集,利用GBLUP、BayesA、BayesB和BayesCπ估计全基因组育种值,使用校正表型值与估计育种值的相关系数作为估计准确度,经5倍交叉验证以后得到的全基因组估计的准确度范围是0.329(GBLUP估计上脑性状)到0.490(BayesB估计外脊性状),所有性状的平均估计准确性是 0.390(GBLUP),0.406(BayesA),0.432(BayesB)和 0.408(BayesCn)。对于本研究中的大多数性状来说,贝叶斯方法的估计准确性高于GBLUP。针对贝叶斯方法计算时间长的问题,利用并行计算缩短运行时间,具体:(1)提出了基于传统并行MCMC技术的多链并行贝叶斯方法,使用模拟数据集和西门塔尔肉牛群体的育肥日增重、活重、胴体重、屠宰率、净肉率和零售肉重6种性状进行全基因组估计研究。标记效应使用GBLUP和3种并行贝叶斯方法进行估计,并行贝叶斯方法包括多链并行 BayesA,BayesB 和 BayesCπ(PBayesA,PBayesB 和 PBayesCπ)。在模拟数据集上获得与串行贝叶斯方法相同估计准确性的情况下,并行贝叶斯方法极大地缩短了运行时间。真实数据集全基因组估计的准确性范围是0.195± 0.084(GBLUP估计净肉率性状)到0.424± 0.147(PBayesB估计胴体重性状)。6种性状的平均估计育种值为0.327±0.085(GBLUP),0.335±0.063(PBayesA),0.347±0.093(PBayesB)和 0.334±0.077(PBayesCπ)。(2)为了获得精确的全基因组估计结果,MCMC中的burn-in通常设置成很大的值,而进入平衡状态以后,更多的burn-in迭代都无助于MCMC运行结果的改善。针对这一问题提出了基于并行MCMC和多链收敛性诊断的自适应burn-in并行全基因组估计技术。在研究中将BayesA和BayesCπ应用到自适应burn-in并行全基因组估计中,使用模拟数据集对自适应多链并行 BayesA(TunBpBayesA),自适应多链并行 BayesCπ(TunBpBayesCπ)和固定 burn-in 多链并行 BayesA(FixBpBayesA),固定 burn-in 多链并行 BayesCπ(FixBpBayesCπ)以及 GBLUP 进行比较。TunBpBayesA(或 TunBpBayesCπ)与 FixBpBayesA(或 FixBpBayesCπ)的估计准确性相同,但是 TunBpBayesA(或 TunBpBayesCπ)的加速比远远高于 FixBpBayesA(或 FixBpBayesCπ)的加速比。使用真实数据进行全基因组估计,TunBpBayesCπ的全基因组估计准确性高于TunBpBayesA 和 GBLUP。研究结果表明:①贝叶斯方法和GBLUP在中国西门塔尔肉牛群体中估计背最长肌和里脊性状的全基因组选择是可行的;②并行全基因组估计方法对于中国西门塔尔肉牛也是可行的;③自适应burn-in多链并行BayesA(和BayesCπ)比固定burn-in多链并行BayesA(和BayesCπ)相比,估计结果可靠,加速比更高。自适应burn-in多链并行BayesA(和BayesCπ)在使用CPU内核上展示出极好的可扩展性,在应用到其他的贝叶斯方法表现出很好的灵活性。本研究中涉及到的贝叶斯方法、GBLUP和并行贝叶斯方法将在肉牛育种规划中帮助识别肉牛经济性状优异的候选个体。