论文部分内容阅读
全基因组关联分析(Genome-wide Association Study,GWAS)和基因组选择(Genomic Selection,GS)已经成为研究人类和动植物复杂性状遗传基础和表型预测的重要手段。随着测序技术的发展,人类和动植物基因组的功能注释不断完善,在GWAS和GS中整合SNP的生物学注释信息将有利于复杂性状遗传基础的挖掘和表型预测准确性的提高。因此,本研究基于混合线性模型分别在GWAS和GS中提出整合功能注释信息的策略和模型,建立了整合先验生物学信息的全基因组最佳线性无偏预测(incorporate Prior biological information in Genomic Best Linear Unbiased Predictor,pGBLUP),整合多种注释信息鉴定性状相关组织(Scalable Multiple Annotation integration for trait-Relevant Tissue identification and usage,SMART)两种遗传学分析方法。本研究的主要研究结果如下:(1)建立了pGBLUP模型和方法,通过模拟比较pGBLUP和常见基因组选择方法(GBLUP和Bayes R),发现pGBLUP使用生物学注释信息可以提高基因组选择功效,但对注释信息的功能也存在依耐性;(2)pGBLUP模型可以被拓展后用于遗传力富集分析,可以准确估计不同功能注释信息的遗传力富集程度,作为衡量不同功能注释对性状性状影响的指标;(3)pGBLUP应用于奶水牛基因组选择,奶牛产奶性状QTL区域对奶水牛产奶性状具有中等较弱的遗传力富集(fe<5),在奶水牛样本量有限(412头)的情况下,整合奶牛产奶性状QTL信息以提高奶水牛产奶性状基因组选择的效果不明显,但pGBLUP为将来在小群体中整合先验生物学功能信息进行基因组选择提供了策略;(4)pGBLUP应用于仔猪八字腿功能注释信息遗传力富集分析,鉴定出了在仔猪八字腿遗传力上高度富集(fe>100)的7条KEGG信号通路,其中信号通路KEGG_MTOR_SIGNALING_PATHWAY控制肌肉发育,值得进一步深入研究;(5)建立了SMART模型和方法,通过模拟测试以及真实数据应用,发现SMART整合多种注释信息有利于准确鉴定性状相关组织(细胞),且利用SMART鉴定的性状相关组织构建的SNP权重,可以提高SNP-set检验功效,在GWAS中鉴定出更多的位点;(6)SMART应用于人类复杂性状和基因组功能注释公共数据:根据性状与组织相关性,将43个性状分层聚为5大类,从整合多组学功能注释信息角度发现性状之间的相关关系;同时对不同组蛋白注释信息效应的估计,发现组蛋白H3K4me1和H3K4me3具有较大效应,适合进行基因组功能预测。总之,本研究建立了整合功能注释信息的基因组选择方法pGBLUP和全基因组关联分析方法SMART,通过整合功能注释信息提高基因组选择和全基因组关联分析的功效,将为复杂性状遗传基础的研究和表型预测提供新的思路和工具,有助于通过整合和利用动物多组学功能注释信息加快动物的遗传选育。