关联分析和基因组预测相关方法的探讨与应用

来源 :扬州大学 | 被引量 : 5次 | 上传用户:chiale
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联分析和基因组预测是对植物复杂数量性状进行基因鉴定和遗传改良的重要方法。自2001年以来,应用关联分析方法发掘植物数量性状基因就备受关注,大量的方法以及软件包已经涌现,统计功效和运算效率也随之增加,然而针对多位点、多性状的关联分析还未受到广泛关注。此外,近年来,基因组预测也成为国际植物基因组学研究的热点,不同于传统的标记辅助选择,基因组预测利用染色体组上的全部的标记信息来预测植物自交系或者杂种后代的表现,能够大大缩短育种时间,从而有效降低了育种成本。大量的参数方法、半参数及非参数方法已用于基因组选择。随着分子生物技术的发展,能够获得各种组学的数据,包括代谢组和转录组等,这为表型预测提供了新数据源。但如何有效利用这些组学数据以及预测方法,还未见系统的比较以及应用。基于此,本文基于LASSO和偏最小二乘分别提出了多位点和多性状的关联分析方法,旨在提高关联分析的检验功效;此外,本文分别基于玉米自交系群体以及杂交水稻群体对多种统计方法和不同组学数据的预测力进行比较,并利用相关组学信息预测了水稻重组自交系群体所有潜在杂交种的产量。研究内容主要包括以下两个方面:一、多位点和多性状关联分析(1)基于LASSO的多位点关联分析方法。多位点的关联分析方法能同时考虑所有位点,并且不涉及多重测验校正,因此与单位点方法相比具有更高的检测功效。本研究将LASSO方法用于关联分析,并首次采用两种显著性测定方法检验LASSO方法中位点的显著性,分别为基于bootstrap的LASSO-A和基于混合模型方程的LASSO-B,并通过模拟研究比较了基于混合线性模型的GEMMA方法和LASSO方法的检验功效和假发现率。模拟结果表明LASSO-A方法具有最高的检验功效以及最低的假发现率,即使位点的表型贡献率很低,LASSO仍可以检测到。本文利用LASSO-A、LASSO-B和GEMMA方法对422份油棕材料的13个经济性状进行GWAS,LASSO方法共检测到19个与经济性状相关的标记位点,很大一部分在前人通过连锁分析获得的QTL附近,而GEMMA方法仅检测到三个显著SNP,并且均被LASSO方法检测到。在LASSO方法检测到的显著位点中,一些位点具有一因多效性,控制了多个性状,并且这些性状间也显著相关。无论在模拟数据还是实际数据中,LASSO均有较高的检验功效,该方法是对现有关联分析方法的一个很好的补充。(2)基于多元偏最小二乘的多性状联合关联分析。在实际育种工作中,经常要同时考虑多个复杂性状。多性状联合分析既可利用性状之间的遗传相关又可利用环境相关信息,可有效提高分析结果的精确度。本文提出了用于优异等位基因挖掘和遗传效应估计的多性状联合关联分析方法,该方法采用多元偏最小二乘和两阶段变量选择策略,结合BIC信息准则进行最优模型中变量的选择,通过计算机模拟在不同样本大小,遗传力以及PIC下研究该方法的可行性,并与单性状多位点关联分析进行结果比较。结果表明:相比于单性状分析,多性状联合分析可以提高检测功效,尤其对一因多效基因优势更加明显;样本容量、遗传力、PIC以及效应值的大小均对候选基因的统计功效、效应估计值的准确度和精确度具有重要影响。二、基因组预测方法比较研究及其应用(1)玉米自交系中组学预测的统计方法比较。为了更好地了解不同组学数据和不同方法的预测准确性,本文利用339个玉米自交系中测量得到100K个SNP,28769个转录产物,748个代谢物作为数据源,采用8种预测方法对6个玉米农艺性状进行预测,并比较不同数据来源和不同方法的预测效果。方法包括LASSO,最佳线性无偏预测(BLUP),BayesA,BayesB,偏最小二乘法(PLS)以及再生核希尔伯特空间(RKHS)和支持向量机(SVM-RBF和SVM-POLY)。结果表明在玉米自交系农艺性状的预测中,BLUP方法在所有组学和性状的综合预测效果最好,基因组预测较代谢组和转录组的预测效果好。本文将所有组学数据合并后对6个性状进行预测,发现预测力没有明显提高。此外,为了更好的了解性状的遗传结构,对6个性状进行了全基因组关联分析,同时利用LASSO方法检测出对农艺性状有显著影响的代谢物。最后,根据不同的阈值进行了标记的筛选,并利用筛选后的标记进行了基因组预测,通过交叉验证发现预测效果没有明显改善。(2)杂交水稻产量及其相关性状的组学预测。利用水稻的基因组,转录组以及代谢组的数据对水稻杂交种的产量及其构成性状进行预测并对预测效果进行评价。本文从210份水稻重组自交系亲本中有可能产生的21495个杂交种中,随机选择278份材料进行表型鉴定,并利用这278份材料作为训练样本来预测所有可能样本的产量相关性状,发现由代谢物预测出的产量最高的10个潜在杂交种,它们的产量比平均产量提高30%。相比于基因组数据,使用代谢组和转录组数据对杂交种产量的预测力较高。
其他文献
水稻是我国重要的粮食作物,其产量高低涉及粮食安全。水稻产量构成要素主要包含有效穗数、穗粒数、粒重、结实率等,其中粒重主要是受粒型和灌浆影响。尽管已经有一些粒型相关
网络社会对群体性事件的演变机理具有结构性的影响,并对其形成机理、发展机理、变异机理和终结机理四大机理产生作用力。网络社会群体性事件的生成是由于地方性偶发事件,但其
高丹草是典型的利用杂种优势的饲草作物,然而其杂种优势产生的分子机理仍然不清楚。蛋白质组学研究为解析杂种优势的分子机理提供了新方法。本研究以杂种高丹草及其亲本为试
为增强高校思想政治理论课的教学效果,在阐述思想政治理论课运用微课的概况的基础上,充分剖析高校采用微课进行思想政治理论课教学过程中存在的问题,从微课设计、制作及运用
随着数字化校园建设的不断推进,提高数字化校园服务质量,提升校园信息化管理水平等已成为教育主管部门日益重视的问题。该文针对高职数字化校园服务管理的现状及存在问题,将I
目的探讨集束化护理对胃大部切除术后胃瘫综合征病人负性情绪及胃肠功能的影响。方法将郑州人民医院于2016年1月-2018年1月收治的68例胃大部切除术后胃瘫综合征患者纳入本次
文中介绍了具有光束水平指示功能的固定安装式和便携式激光指向仪的功能及其应用。
在矿区GPS控制网数据后处理过程中,对长度投影变形的处理不可回避。文中提出了处理投影变形的理论依据,对限制长度投影变形的方案进行了综述,并通过对各种解决方案的分析讨论,提出了处理矿区GPS控制网投影变形的基本原则。
新一代信息技术在教育领域的广泛应用极大改变了教育环境,也影响着教育教学的改革创新。在这样的大环境下高校思想政治理论课教学面临诸多挑战,一方面西方各种不良思想、价值
基于网络状结构的供应链系统成为了支撑商流的物质载体,供应链系统完善与否直接决定着茶叶品质保持的绩效,也直接决定着茶叶投放市场的响应时效。当前应更加关注茶企如何提升