聚类分析在多位点全基因组关联分析群体结构控制中的应用

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:wang8550cimc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动植物绝大多数重要性状是数量性状,全基因组关联分析(genome-wide association studies,GWAS)是解析数量性状遗传基础的主要途径。但关联群体的群体结构会导致标记与数量性状的虚假关联。目前,常用的群体结构是每个个体属于不同亚群的概率和主成分得分。最近,新提出的进化群体结构是基于进化类型划分的,个体分类明确。聚类分析作为广泛应用的分类方法,尚未用于度量关联群体的群体结构。因此,有必要探索聚类分析在全基因组关联分析群体结构控制中的应用。为探索聚类分析在关联分析群体结构控制的可能性。本研究利用关联群体分子标记信息,选用层次聚类Hclust、K均值聚类Kmeans和稀疏子空间聚类En SC与SSC_OMP方法计算关联群体的群体结构。通过上述4种聚类分析方法,将个体分成若干类,以用于关联分析的群体结构控制,这称为聚类群体结构。与常用的群体结构方法进行比较。通过真实数据分析和模拟研究,获得了聚类群体结构可用于多位点全基因组关联分析群体结构控制的结论。其主要结果如下:1)首先,确定最优聚类簇数。在不同聚类簇数下,用FASTmr MLM和FASTmr EMMA两种多位点GWAS方法检测413个水稻品种36901个SNP标记与粒宽的关联。通过比较不同聚类簇数下4类聚类群体结构检测的QTNs数和QTNs附近与性状关联的已知基因数,得到最优聚类簇数。为了验证聚类群体结构的有效性,用FASTmr MLM方法检测水稻粒宽的QTNs。在无群体结构NULL、主成分群体结构PC、Q矩阵群体结构Admixture和上述En SC、SSC_OMP、Hclust和Kmeans的4种聚类群体结构情况下分别检测到26、12、12、17、22、18和22个QTNs,分别挖掘到9、6、7、11、11、11和10个QTNs附近的已知基因。在FASTmr EMMA中,在上述7种情况下分别检测到10、7、4、8、11、10和10个QTNs,分别挖掘到2、2、2、6、7、7和7个QTNs附近的已知基因。这表明聚类群体结构比常用的群体结构检测到更多的QTNs和已知基因。虽然比无群体结构找到更少的QTNs,但是发现了更多的已知基因。因此,聚类群体结构关联分析结果最好。2)通过Monte Carlo模拟研究验证聚类群体结构的可行性。在199个个体10000个标记的拟南芥自然群体中,模拟了6个贡献率为5.00%~15.00%的QTNs。用FASTmr MLM和FASTmr EMMA方法分析这些模拟数据集。从QTN检测功效、QTN效应估计精度和假阳性率三个方面,比较不同群体结构对关联分析结果的影响。结果表明:在FASTmr MLM方法中,Hclust聚类群体结构的检测功效比PC群体结构高7.8%,其QTN效应估计值的MSE和假阳性率比PC的低;SSC_OMP聚类群体结构的检测功效比Admixture高1.0%,其MSE和假阳性率比Admixture低。在FASTmr EMMA方法中,也有相似的结论。因此,模拟研究证实在多位点全基因组关联分析中使用聚类群体结构效果更好。这验证了真实数据分析中得到的结论。本研究为全基因组关联分析提供了计算群体结构的新算法,可以提高QTN检测功效和精度,更好地控制假阳性率。
其他文献
经济的快速提升导致了家庭婚姻观念产生了变化,高离婚率的社会现象继而出现,这种高离婚率的状况不仅引起了公众的焦虑,也使我国成为世界上离婚最自由的国家之一。为解决高离婚率引发的一系列社会问题,2020年5月28日颁布的《民法典》在婚姻家庭编第1077条出台了离婚冷静期制度,即在民政部门收到离婚申请的三十日内,夫妻双方或者一方不愿意离婚的可以申请撤回,同时三十日过后夫妻双方未去民政机构领取离婚证,视为自
学位
学位
随着老龄化和城镇化的发展,可用耕地面积和农业劳动力不断减少,传统的水稻生产模式已不再适合我国农业发展的要求。水稻轻简化栽培技术是通过降低人力、物力的投入来提高生产效益的新型技术,目前常用的是直播稻和再生稻两大类。然而,目前适合此种植模式的水稻品种仍然匮乏。因此评价、筛选适宜再生稻和直播稻生产的水稻种质,并对再生稻的再生力性状以及直播稻的抗倒伏、耐低氧出苗率性状开展遗传分析,对水稻轻简化栽培生产具有
学位
干旱是制约作物生长与产量形成的主要环境因素之一。棉花是在我国大面积种植的经济作物。而我国的棉花主产区——新疆却因常年灌溉不足,限制了棉花的高效生产。在水资源不足,棉花抗旱品种育种年限较长的背景下,开发新的抗旱解决方案有助于棉花高效生产。纳米技术近年来快速发展,具有巨大的应用潜力,是解决农业科学问题的有力工具。本试验以我国新疆地区主栽棉花品种新陆早74号为研究对象,筛选发现环境友好型Mn3O4纳米材
学位
水稻是最重要的粮食作物之一。作为喜温植物,水稻易受低温的胁迫导致减产,提高耐冷性是育种学家一直以来追求的目标。随着候选基因关联分析(candidate gene association study,CGAS)应用的进一步延伸,许多研究者将这项技术运用到植物耐冷性SNP位点筛选。温度诱导的载脂蛋白(temperature-induced lipocalin 1,TIL1)是一类在真核细胞中的载脂蛋白
学位
挖掘复杂性状的基因是分子生物学研究、基因编辑和作物育种的基础。在过去的二十年里,全基因组关联分析(genome-wide association studies,GWAS)已成为剖析复杂性状遗传基础的主要方法之一。因此,研究GWAS方法学与研制其软件包具有十分重要的意义。自GWAS混合模型方法建立以来,前人提出了一系列方法并研制了相应的软件包,以挖掘数量性状基因。虽然这些方法及其快速算法可检测关联
学位
关于物业服务业安全保障义务的法律适用问题,在物业服务合同出台之前就引起了热议。实践中的案例也促使立法上对该问题作出规定,即体现于《民法典》第九百四十二条以及《物业管理条例》第四十五条和第四十六条。然而现阶段关于物业服务业的安全保障问题的案件频发,法律法规相关规定仍较为宽泛,关于安全保障义务的内容、判断标准以及物业服务业的角色定位,理论上尚存争议,且司法实践中法官在判断物业服务业是否尽到合理的安全保
学位
目前,我国的农业经营主体范围不断扩大,规模化耕作经营是农业发展的必然趋势,资金紧张且融资困难成为阻碍农业经营发展的大问题。为不断深化我国农村金融改革,赋予农业经营主体更多的财产权利,国家在政策层面突破了土地经营权抵押的相关规定,对试点地区进行特别授权,鼓励探索,积累实践经验。《民法典》将土地经营权的相关内容写入物权编内,明确了土地经营权的用益物权性质,明确了依法取得权属证书的承包地,可以通过抵押等
学位
国务院于2019年6月22日印发了《加快完善市场主体退出制度改革方案》的通知。该通知中着重提出要逐步建立完善市场退出机制,特别是加快自然人破产制度的建立,对于“诚实但不幸”的自然人应当以免除债务,给予其东山再起的机会,节约司法资源,促进社会主义市场经济的平稳运行。通过分析我国的具体实际,探究出一条真正适合我国的自然人破产立法最优路径。我国现阶段所实行的《中华人民共和国企业破产法》是2006年颁布实
学位
双季稻作为我国重要的水稻种植模式,对于增加水稻总产,保障粮食安全至关重要。传统移栽双季稻工序繁琐、劳动强度大和经济效益低,导致农民种植意愿较低。因此,近年来双季稻面积大幅缩减。发展轻简化的双季稻双直播模式对稳定双季稻种植面积意义重大。然而,华中地区作为传统的双季稻区,发展双季稻双直播模式受到温光资源限制,只有生育期为95天左右的超短生育期品种才能满足双季稻双直播的安全生产。本课题组从2014年开始
学位