荷斯坦牛全基因组序列数据填充方法评估及产奶性状纵向全基因组关联分析

来源 :山东农业大学 | 被引量 : 0次 | 上传用户：lanses

【摘要】

：

【作者】

：

滕军

【机构】

：

山东农业大学

【出处】

：

山东农业大学

【发表日期】

：

2022年01期

【关键词】

：

荷斯坦牛全基因组序列数据基因型填充纵向全基因组关联分析随机回归模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

全基因组序列数据包括全基因组变异,有利于帮助识别数量性状或疾病的因果变异,并加速畜禽育种。大群体高深度的全基因组测序成本昂贵,特别是对于家畜来说。一种策略是SNP芯片数据填充至序列数据。该策略使用SNP芯片对目标群体进行基因分型,然后基于高深度测序的参考面板将SNP芯片数据填充至序列数据。这种策略在之前的研究中使用较多。低深度测序已被提出作为另一种经济高效的基因分型方法,用于获得全基因组变异。基因型填充对于这种方法至关重要。人们已经提出几种低深度测序数据填充方法,并成功应用到人和其它物种中。但是,关于这些方法在家畜上的报道还很少。在本研究中,首先评估了不同获得序列数据策略中基因型填充方法的表现。另外,为了提高鉴定影响奶牛产奶性状相关变异的功效,利用填充的全基因组序列数据基于随机回归模型对中国荷斯坦奶牛群体的产奶性状进行纵向全基因组关联分析。具体研究结果如下:（1）本研究将荷斯坦牛的不同中密度SNP芯片数据直接填充至序列数据,评估了三种填充方法（Beagle v5.1、IMPUTE5 v1.1.3和Minimac4 v1.0.2）的表现。结果表明,Beagle5与IMPUTE5和Minimac4相比是将SNP芯片数据填充至序列数据的最佳填充方法,对于50Kv1和50Kv2芯片,填充准确性超过0.8;对于80K、100K和150K芯片,填充准确性超过0.9。（2）本研究利用荷斯坦牛的低深度测序数据（测序深度1×或更低）评估了六种填充方法,包括Beagle v4.1、Gene Imp v1.3、GLIMPSE v1.1.0、QUILT v1.0.0、Reveel和STITCH v1.6.5。比较了测序深度、样本大小、参考面板样本大小和最小等位基因频率对填充准确性的影响。结果表明Reveel不适合我们的数据,因为它的填充准确性非常低。总体而言,Beagle与Gene Imp、GLIMPSE、QUILT和STITCH相比没有优势,尽管它在大多数情况下填充准确性是可以接受的（超过0.9）。Gene Imp、GLIMPSE、QUILT和STITCH在不同情况下各有优势。当有大规模的高深度测序群体作为参考面板时,Gene Imp和QUILT对测序深度和样本大小非常稳定,即使对于测序深度非常低（0.1×）和样本非常小（100）的数据,也得到接近（Gene Imp）或高于（QUILT）0.95的填充准确性。当测序深度大于0.1×时,GLIMPSE表现非常好。对于STITCH,无论有无参考面板,当测序深度大于0.4×和样本大于400时,它都能得到最高的准确性。对于填充耗时,Beagle的速度最慢,花费的时间比其它方法多得多。其次是QUILT,比Beagle快约20～30%。Gene Imp是最快的,只用了Beagle约五分之一的时间。GLIMPSE的时间几乎是Gene Imp的两倍。STITCH和STITCH＿REF的运行时间介于GLIMPSE和Gene Imp之间。总的来说,在没有参考面板的情况下,考虑到填充准确性、发现SNPs数目和填充耗时,STITCH+Beagle是最佳策略;QUILT是有参考面板时的最佳方法。（3）本研究使用填充序列数据对中国荷斯坦牛产奶性状（产奶量、乳脂率和乳蛋白率）进行纵向全基因组关联分析。首先使用Beagle5将6,470头牛的已有的SNP芯片数据填充为序列数据。填充的基因型数据经过滤后,得到6,470个个体的11,153,375个SNPs位点。利用这些SNPs位点,基于随机回归模型对产奶量、乳脂率和乳蛋白率进行全基因组关联分析,共发现了130个显著关联的QTL区域。本研究重点关注了其中的49个QTL区域,并使用log P drop的方法估计每个QTL区域的95%置信区间。在这些置信区中,共发现581个基因,其中与产奶量相关的39个、与乳脂率相关的65个、与乳蛋白率相关的495个。有2个基因（DGAT1和HSF1）与3个性状均相关,另有5个基因（ADCK5、SLC52A2、FBXL6、TMEM249、SCRT1）同时与产奶量和乳蛋白率相关。此外,我们重点关注了只覆盖或重叠一个基因或者包含特别显著top SNP的QTL的置信区间。在这样的区间内发现了28个候选基因。这些基因包括以前研究中多次报道的影响产奶性状的关键基因（DGAT1、HSF1、MGST1、GHR、ABCG2和CSN1S1）和一些本研究中发现有望成为产奶性状的新的候选基因（CCSER1、CUX2、SNTB1、RGS7、OSR2和STK3）。总的来说,我们的研究不仅为影响产奶性状的候选基因提供了新的见解,而且为利用序列数据基于随机回归模型的纵向全基因组关联分析提供了一般性的分析框架。

其他文献

植物油中不饱和醛作为特征氧化指标的适用性

丙二醛（MDA）、4-羟基-2-壬烯醛（HNE）和4-羟基-2-己烯醛（HHE）是3种典型的非挥发性醛类物质，具有基因毒性，与多不饱和脂肪酸（PUFA）的氧化密切相关，在植物油和油基食品中普遍存在。目前关于其生成及与油脂品质相关性的研究较少。本文以我国常见的5种市售植物油为研究对象，借助Schaal加速氧化法探究植物油在模拟储藏过程中MDA、HHE和HNE的生成规律，并结合化学计量学方法探究三者作

期刊

丙二醛4-羟基-2-壬烯醛4-羟基-2-己烯醛脂质氧化主成分分析

高压大功率晶体管3DD155K抗辐照设计

为应对星用电子装备对器件可靠性不断提高的需求、进一步提高高压NPN型功率晶体管的抗辐照能力，对高耐压大功率晶体管3DD155K进行了抗辐照加固设计。设计基于辐照效应对双极型器件的主要损伤机理，综合考虑产品芯片横、纵向结构参数及制造工艺等因素，在满足高耐压与高放大倍数指标前提下，选择合适的高阻层电阻率及厚度，设计适当的基区宽度、浓度及发射区尺寸等，加强复合型表面钝化层在提高抗辐照能力方面的作用。经实

期刊

抗辐照3DD155K型晶体管高压大功率放大倍数

高强度凝胶剂制备及其在淀粉空心胶囊的应用

＜正＞凝胶剂又称为海藻多糖胶,是一种从产自印度尼西亚的天然海洋植物麒麟菜等红藻中提取的天然多糖亲水胶,被广泛应用于国内外食品添加剂、植物空心硬胶囊、化妆品等行业。海藻多糖作为凝胶剂,特别适合应用于淀粉空心硬胶囊的生产,这主要是其结构低粘度和高强度等理化性质特点有关。

期刊

刻刀下的乡土风情——开封朱仙镇木版年画

＜正＞河南开封城南约10公里处的朱仙镇,是我国民间木版年画的发源地之一。朱仙镇年画与天津的杨柳青年画、山东潍坊的杨家埠年画、江苏苏州的桃花坞年画并称中国四大木版年画。它继承了汉唐壁画的传统,由桃符演变而来,有独特的地方色彩和淳朴的民族风格。宋代孟元老的《东京梦华录》上有一段话,一般认为是有关朱仙镇木版年画最早的记载:"近岁节,市井皆印卖门神、

期刊

一种血清滤膜结构

期刊

白花油茶胚性愈伤诱导及植株再生

以白花油茶未成熟胚为外植体,对其消毒方式及胚性愈伤组织培养进行研究。结果表明,未剥果皮的外植体先用75%酒精浸泡60 s后转入0.1%HgCl2浸泡8 min,再转入2%NaClO中浸泡8 min,成活率最高,达86.67%。未成熟胚切块接种于MS+0.5 mg·L-1 2, 4-D+2.0 mg·L-1 6-BA中,胚性愈伤组织诱导最好,诱导率最高, 89.63%;将绿色愈伤组织转接至MS+0.

期刊

白花油茶未成熟胚胚性愈伤组织不定芽分化生根植株再生

“语言积累、梳理与探究”学习任务群的教学研究

2019学年全国高中使用统编版的教材，这一举措体现了立德树人的根本任务，强化了母语地位，更加重视母语教学。教材的更换也反映了我国在坚持不懈地推动语文教育改革，但也正是这一变革，使很多一线教师一时有些不适应，因此急需行之有效的教学设计。本文旨在通过文献与实践相结合的方式，分析“语言积累、梳理与探究”学习任务群的教学现状与困境，并以《拿来主义》为例解析该任务群的课程实施策略，为教学提供参考。

期刊

“语言积累、梳理与探究”任务群策略研究语文学科核心素养

自主选频短波通信系统架构研究

本文提出了一种自主选频短波通信系统架构，通过把短波电台与有线网相结合的方式，使系统具有更高的扩展性和可操作性，并实现在“一张图”上进行语音调度、定位和轨迹显示等功能。该平台架构，在森林消防领域进行了实践，并取得了很好的效果。

期刊

短波自主选频组网平台架构

一种应急救援宿营用帐篷

期刊

民间投资迎六大利好多地集中开启重大项目推介

报纸

民间投资民间资本

荷斯坦牛全基因组序列数据填充方法评估及产奶性状纵向全基因组关联分析

与本文相关的学术论文