基于SNP分子标记的CROPGRO-Soybean花期模拟模型改进

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:bascin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大豆(Glycine max(L.)Merr.)是我国重要的粮食和油料作物。大豆花期是影响大豆生态适应性和产量的重要性状。在大豆育种的过程中,育种者往往需要在多环境试验中种植供试大豆以选择反复表现出固定特性的品种,这种方法费时费力。因此,通过构建基因型-表型互作的大豆花期模拟模型实现花期模拟预测,将会加速育种进程,实现大豆精确育种。基于过程的CROPGRO-Soybean花期模型(简称大豆花期模型)使用品种参数表达不同品种对环境响应的差异。但事实上,品种参数的遗传可解释性一直受到育种专家的质疑。因此本研究旨在探索大豆花期模型品种参数的遗传学基础,并利用单核苷酸多态性(single nucleotide polymorphism,SNP)分子标记数据对大豆花期模型进行改进,从而构建基于基因与环境互作的大豆花期模型。本研究以种植于江苏南京、安徽当涂两地5个环境的江淮大豆育种种质群体309种新品种(系)为材料,花期为目标性状,分别使用蒙特卡洛马尔科夫链方法(Markov Chain Monte Carlo,MCMC)、广义似然不确定性估计(Generalized Likelihood Uncertainty Estimation,GLUE)、差分进化算法(Differential Evolution Algorithm,DE)、遗传算法(Genetic Algorithm,GA)进行了品种参数校正,获取了能够反映品种特性的品种参数。结果表明:GLUE、MCMC、DE、GA的平均均方根误差(ARMSE)分别为2.56d、2.59d、2.59d、2.58d。主要贡献如下:(1)基于MLM的CROPGRO-Soybean花期模型品种参数的遗传学解析针对CROPGRO-Soybean花期模型品种参数遗传学基础未知以及不同校正算法对其产生的影响未知的问题。本研究基于全基因组关联分析(Genome-Wide Association Studies,GWAS)中的混合线性模型(Mixed Liner Model,MLM)方法,对大豆花期模型品种参数进行遗传可解释性研究,比较并分析了 4种不同算法所得品种参数对GWAS结果的影响。结果表明:(1)不同的校正算法会对品种参数所得显著SNP标记造成影响。4种不同的校正算法所得显著SNP位点仅在CSDL参数上有10.1%-44.9%的重复标记,在PPSEN和EMFL中均无重复定位的标记。(2)4种校正算法获得的CSDL和实测花期均显著定位到大豆生育期E1基因(-log10(p)=5.29);GLUE和MCMC获得的CSDL均定位到大豆生育期E9基因(-log10(p)=5.83),两者均是豆科植物特有的调控大豆开花的主效基因,分别解释了 6.94%和7.8%的品种参数变异。(3)CSDL、PPSEN和EMFL均能定位到与自身语义相符的QTL/基因,均具有遗传学基础。在CSDL中,被多种算法和实测花期共定位到的First flower 4-g2、First flower 7-g6均被前人报道与光周期控制大豆花期相关;在PPSEN中,MCMC和GLUE算法分别定位到了First flower 4-g39和Firstflower 4-g76,两者均被认为是具有较大影响力的光温途径控制开花时间基因座;在EMFL中,DE算法定位到的First flower 4-g66以及GLUE定位到的R8 full maturity 10-g8均被前人报道为重要的控制开花时间基因座。(2)基于SNP标记的CROPGRO-Soybean花期模型构建针对不同校正算法所得显著SNP位点差异大导致的特征SNP位点选择策略与表示不明的问题。本研究利用(1)中筛选的显著SNP位点,构建了 SNP-CROPGRO-SFM模型(SNP-Based CROPGRO Soybean Flowering Model,SNP-CROPGRO-SFM),通过对309种供试大豆设计5折交叉验证,比较了 a:选择单一 SNP位点数据集和b:4种算法所得SNP位点数据集的并集两种特征选择策略以及c/d:是否利用GWAS结果的两种SNP编码策略的模拟精度。并将最优策略下的结果与大豆花期模型、基因组选择模型(Ridge Regression Best Linear Unbiased Prediction,rrBLUP)进行 了比较。结果表明(1)SNP-CROPGRO-SFM在提升了 CROPGRO-Soybean花期模型遗传学可解释性的基础上,仍然保持可以接受的模型精度。SNP-CROPGRO-SFM、CROPGRO模型、rrBLUP的ARMSE分别为4.06d、1.82d、5.81d;(2)相对于前人使用的单一校正算法获取特征SNP位点,本文提出了的综合多种校正算法显著SNP的并集的构建特征SNP位点数据集的策略在5折交叉验证平均ARMSE上降低了 0.036d。可见该特征SNP位点选择策略对于SNP-CROPGRO-SFM模型模拟精度有一定的提升。(3)相较于前人采用的基于GWAS结果的编码方式,本文采用的无先验特征SNP位点编码方式使得模型在在5折交叉验证平均ARMSE上降低了 0.404d,可见该编码方法对于SNP-CROPGRO-SFM模型模拟精度有明显的提升。
其他文献
淀粉分支酶(EC 2.4.1.18)属于糖苷水解酶13家族,作为一种糖基转移酶能够水解α-1,4糖苷键产生非还原性末端的糖链,再通过转移酶活性将游离糖链的C1端连接到邻近的葡萄糖单元的C6位置上,形成新的α-1,6糖苷键,从而改变淀粉的支链结构和分支化程度。通过改变淀粉的分支度影响淀粉的特性,使得淀粉分支酶成为一种重要的淀粉加工用酶。本论文对微枝形杆菌Microvirga sp.MC18来源的一种
学位
根据粮食作物生长状况的影响因素在空间上的自相关性和异质性,管理分区技术对一个管理区域进行多个子区域的划分,便于对这些不同的子区域实施不同的管理决策,从而合理化差异化的使用精准农作方案,最大化农业生产收益。在较大规模农业生产管理的多田块尺度范围内,使用由单一田块尺度范围划分的作业单元进行大面积变量精准投入难以实现,针对传统模糊C均值聚类未考虑指标权重问题及其产生的破碎不规则分区结果不适于机械作业的缺
学位
叶片是植物进行光合作用最重要的器官,其健康状况是保证梨树稳产、高产、优产的重要保障,直接影响到我国现代梨产业的可持续发展和经济效益。在梨的实际生长过程中,叶片病害,特别是炭疽病是导致梨树落叶进而影响梨产量的重要因素。由于炭疽病侵染叶片后形成的小黑点属于极小目标,难以被肉眼识别,很容易错过梨叶部病害的最佳防治时期。长期以来,许多科研学者需要采集大量的叶片,带回实验室进行人工检测和统计,不仅劳动量大、
学位
革兰氏阴性动植物病原细菌大多数致病效应子通过Ⅲ型分泌系统分泌到细菌细胞外,然后由病菌Ⅲ型转位子转移到寄主细胞内,进而发挥病理功能。植物病原黄单胞菌Xoo(Xanthomonas oryzae pv.oryzae)也不例外,通过Ⅲ型分泌系统分泌类似于转录激活子(transcription-activator-like effectors,TAL)和 non-TAL 两类效应子,non-TAL效应子也
学位
作物生产对我国具有重要的意义,在实际生产环境中,病虫害问题对于作物产量和质量的影响很大。因此,建立作物病虫害知识库,分析影响作物生产的因素,对作物生产质量的提高,具有研究意义。知识图谱技术是一种能够以更接近人类认知世界形式表达信息的方式,可以更好的对作物病虫害领域信息进行表达,帮助我们理解、组织和查询相关信息。构建一个具有知识问答功能的作物病虫害知识图谱系统,分析农作物种植过程中农户遇到的病虫害问
学位
堆肥科学至今已有100年左右的历史,经过长时间的发展,堆肥在农业领域的作用越来越重要,在固体废物及农业废弃物处理中也开始广泛应用。堆肥腐熟度的评价是堆肥能够安全使用的重要标准,之前的方法主要是通过经验观察堆肥的物理状态变化或者分析堆肥的化学成分变化,操作繁琐且效率低,近些年有科学研究者提出从机器视觉的角度研究堆肥外观变化,利用卷积神经网络实现堆肥腐熟度的快速、准确判断,但在堆肥生产过程中,堆肥表面
学位
为有效提高规模化奶牛养殖场的生产效益,需要实现奶牛的精细养殖。由于精细养殖是根据不同奶牛个体的生存状态采取相应的措施,奶牛的个体识别至关重要。在实际奶牛养殖场中,人工识别法的成本比较高,而电子识别法则受到识别距离的限制,并且多个信号之间会出现干扰,两者都不能满足需求。基于计算机视觉的个体识别方法能在保持识别准确率的前提下实现无接触的奶牛个体识别,具有实际应用价值。目前,基于计算机视觉的奶牛个体识别
学位
植物的油脂不仅能为自身生长发育提供能量,还可以为人类提供食物,制作医药品、日用化工产品和替代能源等。高等植物体内的脂肪酸(fatty acid,FA)合成是一个复杂且涉及多种酶系参与的重要生理代谢过程。植物油脂一般以三酰甘油(triacylglycerol,TAG)的形式贮藏在植物种子油体(oilbody,OB)中,为种子萌发提供大量的能量。油体蛋白(oleosin,OLE)作为油体的重要组成结构
学位
绿豆(Vigna radiata)有着悠久的栽培历史,在中国种植已逾两千年,是我国传统的经济作物,总产量和出口量均居世界首位。绿豆作为药食兼用的小杂粮之一,营养价值丰富,有较高利用价值。但目前我国绿豆育种水平与其他作物相比仍处于较低水平,杂种选育进展缓慢,目前绿豆大粒品种少,绿豆百粒重低,因此育种发展过程中的主要方向就是筛选大粒等性状的绿豆品种,分析其农艺性状,为未来绿豆良种选育做准备。作为作物生
学位
γ-氨基丁酸(γ-aminobutyricacid,GABA)是一种广泛存在于植物中的4碳非蛋白质氨基酸,它可以调节植物的生长发育,也在植物氮代谢、碳代谢、抵御非生物胁迫和生物胁迫中起重要作用。铁(Fe)作为植物必需的微量元素,在植物光合作用、呼吸作用、固氮作用、蛋白质和核酸合成等诸多生理代谢的电子传递或酶促反应中起着重要作用。缺铁使叶绿素合成受阻,导致叶片失绿,影响光合作用,从而影响水稻生长发育
学位