论文部分内容阅读
牛角是一个重要的形态特征,对野生状态下个体的生存竞争优势具有重要的影响。然而,无角表型的自然突变体早在8000年前就已在欧洲和非洲黄牛群体中观察到,且早期研究已证实该性状以显性方式遗传。四川拥有丰富的地方黄牛资源,但历史上全部为有角表型。近几十年中,四川先后引入荷斯坦牛和西门塔尔牛冻精杂交改良本地黄牛,该过程也将决定无角表型的等位基因导入到了该基因池中,现已观察到了一定比例的无角牛。目前已有至少三个独立的遗传标记被证实与黄牛无角表型间存在完全的相关性,即该三个遗传标记中任何一个发生突变均会导致无角表型。为了验证四川黄牛群体中的无角表型相关遗传标记,进而为分子标记辅助选择提供理论基础,我们开展了以下研究:(1)黄牛无角表型候选遗传标记筛选。以蜀宣花牛为试验材料,收集48头无角牛和16头有角牛的耳组织样本,保证个体间无亲缘关系。针对3个与无角表型完全相关的遗传标记(P202ID、P80kbID、P219ID)和4个不完全相关的遗传标记(P5ID、PG1855898A、PC1768587A、PG1654405A),设计PCR引物扩增目标片段,采用毛细管电泳法、Sanger测序和琼脂糖电泳方法进行基因分型。结果发现,48头无角牛中有39头为P202ID突变(36个突变杂合子和3个突变纯合子)、4头为P80kbID突变(0个突变杂合子和4个突变纯合子)、5头为P219ID突变(5个突变杂合子和0个突变纯合子);P219ID突变频率为43.75%,P80kbID突变频率为8.33%,P219ID突变频率为5.68%。同时,1头无角牛没出现这三个候选标记中的任何一个,而所有有角个体均为野生型纯合子。连锁分析发现,P5ID、PG1855898A、PC1768587A和PG1654405A位点间为100%连锁,但与无角表型间不存在完全的相关性。进一步测定了所有个体的线粒体DNA控制区序列,结果发现其中65.6%的个体为普通牛类型(Bos taurus),而34.4%为瘤牛类型(B.indicus),但无角个体的比例在两种类型间不存在显著差异。(2)基于多个遗传标记预测个体角表型的决策模型。由于存在多个独立的遗传标记与黄牛无角表型间具有完全或不完全的相关性,有必要建立基于多个遗传标记去准确预测个体角表型的决策模型。本研究选取逻辑回归、支持向量机和决策树三个模型,以7个遗传标记的基因型作为模型的特征输入去预测个体的角表型。其中,随机选择80%的样本作为训练数据,20%的样本作为测试数据。使用综合评价指标(F1-score)和受试者工作特征曲线(ROC)来衡量模型的性能。结果发现,三种模型中支持向量机和决策树具有更好的性能表现,其F1-score和ROC特征面积均为100%。预测模型在测试数据中的准确度为100%。(3)基于转录组测序数据挖掘无角位点上未被注释的表达信号。针对导致黄牛无角表型的功能基因还没被确定这一问题,本研究从NCBI数据库下载来源于4个品种和20个组织样本的30个转录组数据。经过质量过滤后,将高质量reads 比对到参考基因组序列,采用StringTie软件进行转录本组装。结果在1号染色体381Kb的无角位点目标区域(1.668 Mb-2.049 Mb)共检测到8个基因,其中6个是已被注释的基因(ITSN1、CRYZL1、DONSON、SON、GART、DNAJC28),2 个为未被注释的基因(LOC104970777和LOC112447103)。同源性比对发现LOC104970777在绵羊中的同源基因为DNAJC28,而LOC112447103在山羊、绵羊、藏羚羊、野牛中的同源基因为CRYZL1,这两个基因主要参与高尔基体的合成和体内的氧化还原反应。本研究分析了无角表型相关遗传标记在四川黄牛群体中的情况,建立了基于多遗传标记位点预测个体角表型的机器学习方法,初步挖掘了可能导致黄牛无角表型的功能基因。研究结果可用于建立无角牛分子标记辅助选择方法,加快培育四川黄牛无角群体。