论文部分内容阅读
犬髋关节发育不良(Canine Hip Dysplasia,CHD)是最常发生的矫形外科疾病,几乎所有品种的犬都可发生,特别是大型品种犬,且通常会诱发继发性的骨关节炎(Osteoarthritis,OA)。犬髋关节发育不良是一种多基因控制的复杂遗传疾病,遗传力在0.2~0.7之间。本研究从资源群体中选取721只狗,包含8个品种(Labrador Retriever, Greyhounds, German Shepherd, Newfoundland, Golden Retriever, Rottweiler, Border Collie and Bernese Mountain Dog)和一个由易感品种Labrador Retriever与非易感品种Greyhounds杂交与回交的连锁群体。根据课题组先前的CHD和OA连锁分析QTL定位结果,本研究在Affymatrix公司定制了8条染色体QTL区域的高密度SNP芯片,共3324个SNP位点;其中的551只狗采用此定制芯片测定基因型,另一部分的366只狗采用Illumina公司的Canine SNP20全基因组SNP芯片测定基因型。统计方法采用压缩混合线性模型(Compressed Mixed Linear Model)进行全基因关联分析。通过全基因组关联分析和连锁不平衡分析分别发现4个CHD (COL15A1, EVC, PTPRD和MAGP1)和2个OA (PARD3B和REG3A)的易感候选基因。论文的第二部分建立一种利用全基因组标记信息对犬髋关节发育不良疾病进行早期预测的方法,实现患病风险评估,来预防继发性关节炎(OA)并进行选择性繁殖。分别对两组实验群体进行全基因组高密度基因型测定。第一组为359狗,根据它们的髋关节发育不良估计育种值(Estimate breeding value, EBV)和基因型信息,采用贝叶斯A法建立预测公式,并用两种方法评估这个公式对仅有基因型信息个体的预测准确性。方法一为交叉验证(Jackknife法),即按顺序每次隐去其中一只狗的育种值,利用剩余所有个体的估计育种值和基因型来预测它的基因组育种值(Genomic Breeding Value, GBV)。方法二为独立验证,即独立测定与第一组个体无亲缘关系的38只狗的基因型,来检验预测准确性。交叉验证法表现出很强的相关性,GBV与EBV之间R2大于0.7。独立验证表明预测得到的Norberg角GBV与真实表型值的相关系数为0.5。诊断指标敏感性、特异性、阳性和阴性预测值均为70%以上。该预测方法可广泛应用于犬髋关节发育不良的患病风险评估和早期选择,从而降低发病率。且预测可在幼年期进行,而不受目前影像诊断法的年龄限制。上述研究再次证明了采用贝叶斯(Bayesian)方法估计每一个标记的效应值,是目前基因组预测中最为准确的统计方法,但其过于冗繁的计算量使得它不适用于下一代测序的高密度基因型数据。本研究对GBLUP法进行优化,通过对亲缘关系矩阵的压缩来优化模型拟合度,使得它在保持计算速度优势的同时提高预测准确性。基于这一思路,本论文的第三部分提出了一种全基因组预测的新算法-cBLUPg,除了在犬髋关节发育不良的预测上得到很好应用外,还在其它四个物种的数据集(人、玉米、拟南芥和水稻)上进行了验证。这个新方法相对于Bayes B法能提高2 ~ 15%的准确性,而计算速度可提高近百倍。