一种交替运用固定效应和随机效应模型优化全基因组关联分析的算法开发

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:a7762350
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在全基因组关联分析策略的帮助下,更多的人类疾病和重要农业经济性状的候选基因被发掘出来。但是全基因组关联分析一直饱受两个问题的困扰:大量的假阳性和令人惋惜的假阴性。假阳性是指关联分析结果中对检测标记p值的高估。通常这种高估是由群体结构和个体之间的亲缘关系矩阵造成的。将群体结构作为固定效应加入到一般线性模型中或者同时将群体结构作为固定效应,亲缘关系矩阵作为随机效应加在混合线性模型中可以很好的控制假阳性,但同时两种效应变量与待检测位点之间的混杂问题降低了模型对关联位点的检测效力,造成了一定程度的假阴性。这种现象报道于2010年发表在Nature的一篇拟南芥全基因组关联分析的文章中。由于简单模型(未校正群体分层)p值高估造成的假阳性,和复杂模型(加入了个体间亲缘关系矩阵)p值低估造成的假阴性,开花期类的性状中一些已知的候选基因无论使用一般线性模型还是混合线性模型都无法与背景噪音分离。本文阐述了一个新的算法来解决混合线性模型中存在的混杂问题,名字为―Fixed and random model Circulating Probability Unification‖,简称为FarmCPU。FarmCPU通过交替使用一个固定效应模型和一个随机效应模型来解决模型中的混杂问题。可能关联位点(pseudo QTNs)在固定效应模型中用做协变量来控制假阳性,并通过随机效应模型进行预测。固定效应模型和随机效应模型交替使用直到没有新的可能关联位点加到模型中时,FarmCPU结束。相比混合线性模型,FarmCPU显著的提高了统计效力的计算速度,结果如下:(1)107个拟南芥真实性状的研究结果显示FarmCPU找回了混合线性模型结果中丢失的部分候选基因,并可广泛的应用于人类,猪,小鼠,玉米等各个物种数据。(2)模拟性状的研究结果显示FarmCPU相比当前的混合线性模型具有更高的统计效力,对一个由500个等效关联位点模拟的具有75%遗传力的性状,在10%错误率下,FarmCPU相比混合线性模型多检测到50个关联位点。(3)FarmCPU的计算时间与样本数和标记数成线性比例,一个包含五十万个体,五十万标记的数据可以在三天内完成。因此,研究人员可以用FarmCPU来处理以指数级增长的大数据,而且有更大的可能性成功的检测到感兴趣的候选基因。
其他文献
在中国近现代绘画史上,山水画以黑厚重为特色而又取得非常高的成就者,当推黄宾虹和李可染。目前,他们双双创下各自作品最高价,成为各拍卖公司中国近现代书画的拍卖热点。黄宾
期刊
本试验研究探讨了色氨酸对生长中期草鱼生长性能、肌肉品质、肠道粘膜免疫、屏障功能和抗氧化状态的影响,并确定了生长中期草鱼色氨酸需要量。试验选择540尾健康的生长中期草
褪黑激素(Melotonin,MLT)是调控动物季节性繁殖的重要神经类激素,褪黑激素四个合成酶中,5-羟色胺-N-乙酰基转移酶(AA-NAT)和羟基吲哚-氧-甲基转移酶(HIOMT)是合成褪黑激素中最关
笔者相信陈天桥这个名字很难从这一辈IT人的心头抹去,但是还有多少人记得陈天桥的潘多拉之盒呢?那个被人俗称名为“盛大盒子”的IPTV盒子类似物,在2006年的第二季用一种业界
β-胡萝卜素在动物体内具有多种功能,不仅是维生素A原,还具有很强的抗氧化性,可保护机体免受自由基和脂质过氧化的损伤,对机体的免疫、繁殖等功能起着重要的调节作用,但由于β-胡
根据已知 CYP4家族的保守氨基酸区域设计引物,应用cDNA末端快速扩增(RACE)技术,首次从我国近海广泛分布的多毛类——不倒翁虫(Sternaspis scutata)体内克隆出细胞色素氧化酶CYP
目的:本试验旨在探索平菇菌糟替代苜蓿对福建黄兔生产性能和肠道菌群的影响,为菌糟作为非常规饲料资源在福建黄兔配合饲料应用中提供理论依据。试验方法:选用35土2日龄断奶福建
本论文分别以北京油鸡、五指山小型猪肝脏提取的总RNA为模板,通过RT-PCR方法克隆目的基因片段到PGEM-T Easy载体上,构建北京油鸡PGEM-T-IL-15、PGEM-T-IL-18、PGEM-T-CRABP、
牙鲆是我国重要的海水养殖鱼类,广泛分布于我国沿海地区,为广大养殖户带来了巨大的经济效益。对牙鲆进行遗传改良有助于实现牙鲆种质资源的优化和保护,推动牙鲆养殖业的健康