牛SNP芯片分型检出率和分型错误率对基因型填充准确率的影响

来源 :遗传 | 被引量 : 0次 | 上传用户:xumeg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SNP芯片已被广泛应用于动植物的遗传研究和生产实践,其基因分型的准确性至关重要。但在实际应用中,常有一定数量的基因型因缺失而需要去估计(填充)。此外,由于各种原因,又常常需要在不同芯片的基因型之间相互填充彼此没有的SNP基因型,或从低密度SNP填充到高密度SNP基因型。因此,基因型填充准确率直接影响后续数据分析的准确性和可靠性。为深入了解基因型填充准确率的影响因素,本研究利用20 116头美国荷斯坦牛的50K SNP芯片基因分型数据,在SNP分型检出率与错误率存在相关和没有相关两种情形下,分别评估了上述两个因素对下游基因型填充准确率的影响。当两者不相关时,模拟的SNP分型检出率从100%降低到50%,SNP分型错误率由0%提升到50%。当两者存在相关时,基因分型的检出率和错误率之间的关系是基于一个实际数据中这两个变量之间的线性回归方程来确定,即模拟的SNP分型检出率从100%降低到50%,SNP分型错误率从0%升高到13.35%。最后,采用5折交叉验证的方法评估基因型填充的准确率。结果表明,当原始数据的SNP分型检出率与错误率彼此独立发生时,基因型填充的错误率受原始SNP分型检出率影响不大(P>0.05),却随着原始SNP分型错误率的升高而显著提高(P<0.01)。当原始数据的SNP分型检出率与错误率存在负相关时,基因型填充的错误率随着原始SNP分型检出率的降低而显著提高(P<0.01)。在这两种情形下,建议SNP分型检出率应在90%以上,基因型填充准确率才能不低于98%。该结果可为提升实际的SNP分型和下游数据分析的质控提供参考依据。
其他文献
为探索池塘工程化跑道式循环水养殖系统中养殖区跑道内流场分布及集污区固相颗粒分布特征,该文以稠密离散相模型对养殖系统进行流速仿真,并对9组0.03~2.00 mm不同颗粒直径的
目的:探讨三维动脉自旋标记成像(3D-ASL)全脑灌注成像技术在脑胶质瘤中的应用价值。方法:前瞻性选取医院收治的18例颅内胶质瘤患者,其中10例高级别胶质瘤、8例低级别胶质瘤患
微涡流絮凝作为矿井废水处理的预处理工艺,对去除悬浮物有很高的效率。通过某矿区废水处理工程的运行实践表明,进水悬浮物浓度在1400~2200mg&#183;L-1时,微涡流絮凝对悬浮物去除
着重介绍了采用湿式球磨法通过机械粉碎、物理挤压,将不规则颗粒状锌粉加工成鳞片状锌粉的制备方法。
目的分析急性脑血管病心电图特点及其临床价值。方法选取我院2017年6月-2018年8月收治的80例急性脑血管病患者作为研究对象,所有患者均采用我院心电图机行常规心电图检查,然
目的:本研究意在分析282例2型糖尿病患者糖化血红蛋白(glycated hemoglobin,HbA1c)及糖化白蛋白(glycated albumin,GA)与全天七点血糖值之间的相关性,以探讨更合理有效的血糖
为了揭示膨胀性黄土隧道在降雨作用下围岩与支护破坏机理,采用有限元软件对膨胀性黄土地层中的静游隧道开挖进行数值模拟。结果显示:由于降雨,隧道拱顶上方塑性区贯通并产生较
目的总结分析临床检验分析前的影响因素,从而针对性的采取质量控制措施。方法选取2014年4月~2016年3月我院收治的进行临床分析前出现差错的患者120例为研究对象,对这些患者在
阐述了真实有效的会计信息的含义,分析了虚假会计信息的产生及失控原因,指出了提高会计信息质量的有效途径。
目的 探讨大鼠急性脊髓损伤后线粒体形态结构和线粒体膜电位的变化.方法 SD大鼠36只,随机分为对照组(假手术组)和脊髓损伤组(SCI组),每组又分为处理后4h、8h、16h组(各6只).SCI组采