论文部分内容阅读
全基因组关联分析(GWAS)近年来广泛用于人类疾病和动植物重要经济性状的候选基因挖掘工作中,多年来在各物种中都取得了一定的成功。但是,由于群体结构、分析模型等因素的限制,很多与性状相关的基因尚未被完全发掘。同时,大量的研究也报道了很多假阳性结果,降低了后续的工作效率。因此,找到合适的关联分析方法,降低假阳性比例的同时提高检验功效,对该领域的研究具有重要意义。本研究使用了一种优化求解的方法(FarmCPU)对中国荷斯坦牛的生长性状进行GWAS,并通过模拟对该方法在阈性状GWAS中的应用进行了评价。首先,本研究利用FarmCPU方法对3325头中国荷斯坦牛的6、12、18和24月龄体高和胸围进行了 GWAS分析,发现了 27个SNP位点存在与生长性状在全基因组水平的显著相关,并通过候选基因分析找到66个候选基因。在对候选基因信息的进一步挖掘过程中,找到ATP1A1、DYRK1A、JUN、CEP135、CYP26B1、MYC、SOX6和FGFRLI1等8个候选基因在人类和小鼠的骨骼和肌肉发育中发挥重要作用,但是这些候选基因在奶牛的生长性状研究中均为首次报道。这一结果证明FarmCPU方法可用于奶牛生长性状的GWAS研究。之后,本研究基于logistic回归模型(1ogistic regression model)理论提出了新的阈性状模拟方法并开发了相应的阈性状模拟程序。新方法有别于传统的基于阈模型理论的阈值模拟法,在模拟过程中引入"偏好性"概念,为阈性状的表型增加了随机性。通过对比不同参数组合下两种模拟方法模拟的表型在GWAS分析中的表现,发现现有的阈值模拟法进行模拟的阈性状表型进行GWAS检测时的检测效果要好于与新的模拟方法,这可能是导致对阈性状的GWAS方法类研究中模拟效果优于实际数据的原因。用两种模拟方法均可以证明,阈性状GWAS分析时,logistic回归模型在检测阈性状时的效果与一般线性模型没有显著差异。奶牛的繁殖性状中阈性状较多,且遗传力较低,GWAS分析的检测效果不理想。通过对比不同方法在模拟阈性状中的表现,本研究证明FarmCPU方法在阈性状GWAS分析中的表现优于其他方法。因此,本研究通过对FarmCPU方法在中国荷斯坦牛生长性状和使用该群体部分数据模拟的阈性状进行GWAS分析,发现FarmCPU在对中国荷斯坦牛重要经济性状的GWAS分析中具有优势。