论文部分内容阅读
揭示复杂或数量性状遗传结构(Genetic architecture)(例如致因突变的分布及其效应)和基因组预测(Genomic prediction),是人类医学、动植物育种和进化研究中的重要组成成分。复杂性状的遗传变异通常受到极少量大效应基因和大量微效基因的共同控制。当样本量不够大的时候,传统的单核苷酸多态性(Single nucleotide polymorphism,SNP)回归分析很难检测到其中的微效基因。复杂性状的致因突变通常会聚集在特定的基因组区域内,本文把这些基因组区域称为基因组特征(Genomic feature)。基因组特征可以利用各种生物学知识去定义,比如基因、信号通路以及功能基因组学的研究结果。通过评估基因组特征中所有遗传标记对复杂性状的整体效应,有助于揭示复杂性状的遗传基础,从而提高基因组预测或选择的准确性。本文把这方法称为基因组特征模型分析(Genomic feature model analysis)。在第一章文献综述里,本文总结和讨论了 1)基因组特征的定义方法,2)基因组特征的分析、应用以及潜在的挑战。更好地了解基因组特征模型分析的细节,将有助于结果的解释,并确保不同研究之间结果的可比性。针对奶牛的乳房炎和三个产奶性状(包括产奶量,乳蛋白量和乳脂量),本研究进行了四个性状的基因组特征模型分析。主要结果如下:研究1:本研究旨在鉴定奶牛金葡菌乳房炎的候选基因、miRNA以及信号通路。在高浓度(109 cfu/mL)或低(106cfu/mL)浓度金葡菌体内感染荷斯坦牛乳腺24小时后,通过与阴性对照组乳腺(注射生理盐水)比较,研究了奶牛乳腺组织中转录组和miRNA组的表达水平的改变情况,并与牛的数量性状基因座(Quantitative traits loci,QTL)数据库(cattle QTL database)进行了比对分析。结果发现,在高浓度金葡菌感染的乳腺组织中,鉴定出194个显著差异表达的基因(FDR<0.05,|log2(差异倍数)丨>1)和2个显著差异表达的miRNA,而在低浓度金葡菌感染的乳腺组织中仅发现21个显著差异表达基因,且未发现差异表达的miRNA。这一结果显示,奶牛乳腺转录组和miRNA组对金葡菌感染的反应具有剂量依赖性。高浓度金葡菌感染后,与先天性免疫相关的许多生物学通路受到了影响,包括细胞因子-细胞因子受体互作通路和炎症反应通路等。通过与之前报道的奶牛乳房炎相关QTL的比对分析,共鉴定出28个金葡菌乳房炎相关候选基因,包括CXCL14,KIT和SLC4A11 等。研究2:为了探究乳房炎和产奶性状的遗传及生物学基础,本研究利用SNP-set test方法整合分析了 GWAS和转录组数据。结果发现,大肠杆菌内毒素(LPS)感染奶牛乳腺3小时后,肝脏组织中的差异表达基因与乳房炎更相关;而在感染后期(6-48小时),差异表达基因与产奶性状更相关。在大肠杆菌感染24小时后,乳腺组织里的差异表达基因与乳房炎更相关,而肝脏中的差异表达基因和产奶性状更相关。另外,上调和下调的差异表达基因分别与乳房炎和产奶性状更相关。类似的结果存在于三个品种中,即荷斯坦牛、娟姗牛以及北欧红牛。随后,利用基因组特征线性混合模型(Genomic feature linear mixed model,GFLMM)对SNP-set test中最显著的基因组特征进行基因组变异剖分。结果发现,相对于其含有的SNP占全部SNP的比例,这些基因组特征能更大比例的解释遗传变异。研究3:通过利用LPS感染后肝脏中的差异表达基因构建基因组特征,应用基因组特征最佳线性无偏估计模型(Genomic feature best linear unbiased prediction,GFBLUP)对乳房炎和产奶性状在品种内和品种间的基因组预测准确性进行了研究。结果发现,在品种内,相对于标准GBLUP模型,GFBLUP模型的预测准确性略有提高(约3%)。而在跨品种预测中(即利用荷斯坦牛作为参考群体去预测娟姗牛),GFBLUP相对于GBLUP的预测准确性有明显的增加(132.2%)。SNP-set test的结果与GFBLUP的预测能力呈正相关(P<0.05),表明SNP-set test可作为一种计算简便的方法去预筛出重要的基因组特征,用于建立更准确的GFBLUP或类似的模型。研究4:方法与研究3类似,但基因组特征的定义不同,研究4中使用了 Gene Ontology(GO)数据库。GO中详细的基因功能注释使本研究能够进一步研究乳房炎和产奶性状的生物学机制。结果发现,与免疫相关的GO条目和乳房炎更相关,而与代谢相关的GO条目和产奶性状更相关。与GBLUP相比,一些具有生物学意义的GO条目使GFBLUP的预测准确性在品种内和品种间均得到了提高。然而,目前大约只有20%的牛基因注释到了 GO数据库中,这极大限制了本研究的进一步发现。综上,基因组特征模型分析可以整合不同来源的生物学知识,去探讨复杂性状的遗传和生物学基础,并有助于提高基因组选择的准确性。随着生物学知识的迅速积累,基因组特征模型分析将变得越来越有用,尤其是针对测序水平遗传标记的分析。