论文部分内容阅读
大豆源起于中国,因为自身富含的植物性优质蛋白和油分使其在世界范围内具有很大的经济意义,并且在国民生活中也具有十分重要的作用。随着人口的不断增加与生活水平的提高,人们对大豆的需求也保持着快速增长的态势。目前为止,我国高油高蛋白大豆的生产还远不能满足我们生产生活的需要,提高大豆蛋白质和油分含量是育种工作者们迫切需要完成的重要目标。提高高油高蛋白品种的选育效率,采用现代分子育种技术是必不可少的理想手段。研究大豆蛋白质和油分含量性状的遗传、QTL定位以及相关调控基因的挖掘,对于大豆高油高蛋白品种的选育具有重要的理论意义和实践意义。
本研究对包含144个家系的四向重组自交系(FW-RIL)群体进行了大豆660K芯片技术的SNP检测,在经过质量筛选后,共获得109,676个同时满足缺失率小于10%和最小等位基因频率大于5%的高质量SNP标记。结合该群体在多年多点多处理构成的20个环境下的蛋白质含量和油分含量表型数据,首先进行了连锁分析定位蛋白质和油分含量相关的稳定QTL(能在多个环境中重复定位到),而后更进一步的采用5种多位点全基因组关联分析方法进行了关联分析,并获得蛋白质和油分含量相关的稳定QTN(能在多个环境中或通过多种方法重复定位到)。最后结合这两种方法的共同定位结果确定目标QTN,以目标QTN为中心,通过生物信息学手段预测与蛋白质含量和油分含量相关的候选基因,并应用荧光定量PCR技术和大豆种质资源群体的GWAS分析初步验证预测到的候选基因。本研究旨在通过多方法多环境的筛选找到稳定表现的蛋白质含量QTL(QTN)和油分含量QTL(QTN),同时挖掘预测参与调控蛋白质含量和油分含量性状的基因,为分子标记辅助选择育种提供新的理论依据,为优质大豆品种的选育奠定基础。本研究的主要研究结果如下:
(1)通过对20个环境下的FW-RIL群体蛋白质含量和油分含量表型数据进行分析,结果显示:1)这两个性状在群体内的表型差异较大,并且20个环境下均呈现正态分布,联合方差分析结果显示两个性状的基因型方差均达到极显著水平,并且遗传力较高,说明群体内存在真实而丰富的遗传变异,因此适合进行QTL定位研究。2)两个性状的基因型方差虽然都达到极显著水平,但是环境方差和环境与基因型互作方差也都达到极显著水平,说明这两个性状易受到环境条件的影响,并且具有环境特异性。3)20个环境下的相关分析结果显示,同一个环境下的蛋白质含量性状与油分含量性状之间呈现极显著负相关。
(2)基于FW-RIL群体所得的高质量SNP标记,构建了一张覆盖大豆20条染色体的遗传框架图谱,该图谱共包含2332个SNP标记,20条连锁群的总长度为3539.66cM,区间个数1031个,小于5cM的区间个数是835个,对大豆染色体的覆盖率有17条达到90%以上,由此可见该图谱质量较好。
(3)群体结构(Q)分析结果显示,FW-RIL群体共分为两个亚群。连锁不平衡(LD)分析结果显示,以最大连锁不平衡系数(r2)一半所对应的物理距离作为标准,全基因组水平上的LD衰减距离约为1.63Mb。由于FW-RIL群体为亲本衍生群体,所以衰减距离较大,这是正常现象。但为了确定候选基因的搜索范围,本研究将衰减速度最大而后则趋于平缓的那点所对应的物理距离作为搜索候选基因的范围,本研究中所对应的距离约为200kb处。
(4)通过对20个环境下的大豆FW-RIL群体进行连锁分析,共获得108个蛋白质含量相关的QTL,其中能在多个环境中重复定位到的稳定QTL有17个,分布于大豆Chr01(1个)、Chr03(2个)、Chr05(3个)、Chr08(1个)、Chr10(3个)、Chr14(1个)、Chr17(3个)、Chr18(2个)和Chr19(1个)共9条染色体上,有4个稳定QTL能够在3个环境下定位到,剩余的13个稳定QTL均为2个环境下定位到。
(5)通过对20个环境下的大豆FW-RIL群体进行连锁分析,共获得111个油分含量相关的QTL,其中能在多个环境中重复定位到的稳定QTL有23个,分布于大豆Chr01(2个)、Chr05(4个)、Chr07(2个)、Chr08(1个)、Chr09(2个)、Chr10(1个)、Chr13(1个)、Chr14(1个)、Chr15(3个)、Chr18(5个)、Chr19(1个)共11条染色体上,有3个稳定QTL能够在3个环境下定位到,其余20个QTL均为2个环境下定位到。
(6)对20个环境下的大豆FW-RIL群体采用5种多位点全基因组关联分析方法,共获90个蛋白质含量相关的显著QTN,其中能够在多方法或多环境下重复检测到的稳定QTN有22个,分布于大豆Chr01(3个)、Chr02(2个)、Chr03(1个)、Chr04(2个)、Chr06(2个)、Chr07(1个)、Chr09(1个)、Chr10(1个)、Chr12(3个)、Chr14(1个)、Chr16(2个)和Chr18(3个)共12条染色体上,有1个稳定QTN能够在3个环境多种方法(≧2种方法)下检测到,剩余21个均为单环境下多种方法检测到。
(7)对20个环境下的大豆FW-RIL群体采用5种多位点全基因组关联分析方法,共获得99个油分含量相关的显著QTN,其中能够在多方法或多环境下检测到的稳定QTN有34个,分布于大豆Chr01(2个)、Chr02(7个)、Chr03(1个)、Chr04(2个)、Chr05(2个)、Chr07(2个)、Chr08(2个)、Chr09(2个)、Chr10(2个)、Chr11(1个)、Chr14(1个)、Chr15(1个)、Chr16(4个)、Chr17(1个)、Chr18(3个)、和Chr19(1个)共16条染色体上,有1个稳定QTN是通过一种方法在两个环境下共同检测到,4个稳定QTN是在2个环境下通过多种方法检测到,剩余29个稳定QTN是在单个环境下通过多种方法检测到。
(8)结合FW-RIL群体蛋白质含量性状的连锁分析与关联分析结果,确定了5个在两种分析中都能稳定定位到的目标QTN,以目标QTN为中心的200kb范围内,通过生物信息学手段预测有4个基因可能与蛋白质含量性状相关,它们分别为:Glyma.03G100800、Glyma.14G081600、Glyma.18G071100和Glyma.18G071300。
(9)结合油分含量性状的连锁分析与关联分析结果,确定了11个在两种分析中都能稳定定位到的目标QTN,同样以目标QTN为中心的200kb范围内,通过生物信息学手段推测出有5个基因可能与大豆籽粒中油分含量性状相关,它们分别为:Glyma.09G171800、Glyma.18G025500、Glyma.18G027100、Glyma.18G027200和Glyma.18G027300。
(10)通过qRT-PCR手段验证预测的4个蛋白质含量候选基因,其中有2个候选基因在高低蛋白亲本间出现了明显的表达量差异,分别是Glyma14G081600和Glyma18G071300。同样通过qRT-PCR手段验证预测的5个油分含量候选基因,只有Glyma.18G027100和Glyma.18G027200在高低油亲本间表现出了明显的表达量差异。
(11)通过对包含238份大豆种质资源的自然群体进行全基因组关联分析,结果显示检测到的与蛋白质含量相关的显著QTN中,AX-90513683(6,687,807bp )落在候选基因Glyma.18G071300上;检测到的与油分含量相关的显著QTN中,AX-90466431(2,037,422bp)落在候选基因Glyma.18G027100上。因此,Glyma.18G071300和Glyma.18G027100在种质资源全基因组关联分析中同样得到了验证。所以本研究中预测到的可以进行更深一步功能验证的蛋白质含量候选基因为:Glyma18G071300;油分含量候选基因为:Glyma.18G027100。
本研究对包含144个家系的四向重组自交系(FW-RIL)群体进行了大豆660K芯片技术的SNP检测,在经过质量筛选后,共获得109,676个同时满足缺失率小于10%和最小等位基因频率大于5%的高质量SNP标记。结合该群体在多年多点多处理构成的20个环境下的蛋白质含量和油分含量表型数据,首先进行了连锁分析定位蛋白质和油分含量相关的稳定QTL(能在多个环境中重复定位到),而后更进一步的采用5种多位点全基因组关联分析方法进行了关联分析,并获得蛋白质和油分含量相关的稳定QTN(能在多个环境中或通过多种方法重复定位到)。最后结合这两种方法的共同定位结果确定目标QTN,以目标QTN为中心,通过生物信息学手段预测与蛋白质含量和油分含量相关的候选基因,并应用荧光定量PCR技术和大豆种质资源群体的GWAS分析初步验证预测到的候选基因。本研究旨在通过多方法多环境的筛选找到稳定表现的蛋白质含量QTL(QTN)和油分含量QTL(QTN),同时挖掘预测参与调控蛋白质含量和油分含量性状的基因,为分子标记辅助选择育种提供新的理论依据,为优质大豆品种的选育奠定基础。本研究的主要研究结果如下:
(1)通过对20个环境下的FW-RIL群体蛋白质含量和油分含量表型数据进行分析,结果显示:1)这两个性状在群体内的表型差异较大,并且20个环境下均呈现正态分布,联合方差分析结果显示两个性状的基因型方差均达到极显著水平,并且遗传力较高,说明群体内存在真实而丰富的遗传变异,因此适合进行QTL定位研究。2)两个性状的基因型方差虽然都达到极显著水平,但是环境方差和环境与基因型互作方差也都达到极显著水平,说明这两个性状易受到环境条件的影响,并且具有环境特异性。3)20个环境下的相关分析结果显示,同一个环境下的蛋白质含量性状与油分含量性状之间呈现极显著负相关。
(2)基于FW-RIL群体所得的高质量SNP标记,构建了一张覆盖大豆20条染色体的遗传框架图谱,该图谱共包含2332个SNP标记,20条连锁群的总长度为3539.66cM,区间个数1031个,小于5cM的区间个数是835个,对大豆染色体的覆盖率有17条达到90%以上,由此可见该图谱质量较好。
(3)群体结构(Q)分析结果显示,FW-RIL群体共分为两个亚群。连锁不平衡(LD)分析结果显示,以最大连锁不平衡系数(r2)一半所对应的物理距离作为标准,全基因组水平上的LD衰减距离约为1.63Mb。由于FW-RIL群体为亲本衍生群体,所以衰减距离较大,这是正常现象。但为了确定候选基因的搜索范围,本研究将衰减速度最大而后则趋于平缓的那点所对应的物理距离作为搜索候选基因的范围,本研究中所对应的距离约为200kb处。
(4)通过对20个环境下的大豆FW-RIL群体进行连锁分析,共获得108个蛋白质含量相关的QTL,其中能在多个环境中重复定位到的稳定QTL有17个,分布于大豆Chr01(1个)、Chr03(2个)、Chr05(3个)、Chr08(1个)、Chr10(3个)、Chr14(1个)、Chr17(3个)、Chr18(2个)和Chr19(1个)共9条染色体上,有4个稳定QTL能够在3个环境下定位到,剩余的13个稳定QTL均为2个环境下定位到。
(5)通过对20个环境下的大豆FW-RIL群体进行连锁分析,共获得111个油分含量相关的QTL,其中能在多个环境中重复定位到的稳定QTL有23个,分布于大豆Chr01(2个)、Chr05(4个)、Chr07(2个)、Chr08(1个)、Chr09(2个)、Chr10(1个)、Chr13(1个)、Chr14(1个)、Chr15(3个)、Chr18(5个)、Chr19(1个)共11条染色体上,有3个稳定QTL能够在3个环境下定位到,其余20个QTL均为2个环境下定位到。
(6)对20个环境下的大豆FW-RIL群体采用5种多位点全基因组关联分析方法,共获90个蛋白质含量相关的显著QTN,其中能够在多方法或多环境下重复检测到的稳定QTN有22个,分布于大豆Chr01(3个)、Chr02(2个)、Chr03(1个)、Chr04(2个)、Chr06(2个)、Chr07(1个)、Chr09(1个)、Chr10(1个)、Chr12(3个)、Chr14(1个)、Chr16(2个)和Chr18(3个)共12条染色体上,有1个稳定QTN能够在3个环境多种方法(≧2种方法)下检测到,剩余21个均为单环境下多种方法检测到。
(7)对20个环境下的大豆FW-RIL群体采用5种多位点全基因组关联分析方法,共获得99个油分含量相关的显著QTN,其中能够在多方法或多环境下检测到的稳定QTN有34个,分布于大豆Chr01(2个)、Chr02(7个)、Chr03(1个)、Chr04(2个)、Chr05(2个)、Chr07(2个)、Chr08(2个)、Chr09(2个)、Chr10(2个)、Chr11(1个)、Chr14(1个)、Chr15(1个)、Chr16(4个)、Chr17(1个)、Chr18(3个)、和Chr19(1个)共16条染色体上,有1个稳定QTN是通过一种方法在两个环境下共同检测到,4个稳定QTN是在2个环境下通过多种方法检测到,剩余29个稳定QTN是在单个环境下通过多种方法检测到。
(8)结合FW-RIL群体蛋白质含量性状的连锁分析与关联分析结果,确定了5个在两种分析中都能稳定定位到的目标QTN,以目标QTN为中心的200kb范围内,通过生物信息学手段预测有4个基因可能与蛋白质含量性状相关,它们分别为:Glyma.03G100800、Glyma.14G081600、Glyma.18G071100和Glyma.18G071300。
(9)结合油分含量性状的连锁分析与关联分析结果,确定了11个在两种分析中都能稳定定位到的目标QTN,同样以目标QTN为中心的200kb范围内,通过生物信息学手段推测出有5个基因可能与大豆籽粒中油分含量性状相关,它们分别为:Glyma.09G171800、Glyma.18G025500、Glyma.18G027100、Glyma.18G027200和Glyma.18G027300。
(10)通过qRT-PCR手段验证预测的4个蛋白质含量候选基因,其中有2个候选基因在高低蛋白亲本间出现了明显的表达量差异,分别是Glyma14G081600和Glyma18G071300。同样通过qRT-PCR手段验证预测的5个油分含量候选基因,只有Glyma.18G027100和Glyma.18G027200在高低油亲本间表现出了明显的表达量差异。
(11)通过对包含238份大豆种质资源的自然群体进行全基因组关联分析,结果显示检测到的与蛋白质含量相关的显著QTN中,AX-90513683(6,687,807bp )落在候选基因Glyma.18G071300上;检测到的与油分含量相关的显著QTN中,AX-90466431(2,037,422bp)落在候选基因Glyma.18G027100上。因此,Glyma.18G071300和Glyma.18G027100在种质资源全基因组关联分析中同样得到了验证。所以本研究中预测到的可以进行更深一步功能验证的蛋白质含量候选基因为:Glyma18G071300;油分含量候选基因为:Glyma.18G027100。