论文部分内容阅读
小麦(Triticum aestivum L.)是世界上主要粮食作物之一。分子育种和分子设计育种是培育高产、优质小麦的有效途径,而对控制农艺及品质的数量性状基因位点(QTL)进行定位和效应分析,明确基因-性状间的关联和网络调节关系是分子育种和分子设计育种的前提。
近年来,随着基因组学的发展和关联分析理论的不断完善,以连锁不平衡(Linkage disequilibrium,LD)为基础的关联分析(Association analysis)为动植物数量性状遗传的研究提供了新途径,它与基于连锁作图的数量性状位点(Quantitative trait locus,QTL)定位结果相互验证、相互补充。本研究从广泛收集的289份冬小麦材料中选取205份材料组成关联定位自然群体,利用小麦90K SNP基因芯片技术进行高通量基因分型,对自然群体进行遗传多样性、群体结构和连锁不平衡分析,并通过对GLM、GLM_Q和MLM_Q+K三种关联模型的比较分析,选取最适合的MLM_Q+K(Mixed Linear Model,混合线性模型)模型对小麦主要农艺及品质相关性状进行全基因组关联分析(Genome-wide association study,GWAS)。研究结果如下:
1.表型变异分析对关联定位群体40个农艺及品质性状的表型变异分析表明,农艺性状中除了倒三叶长、总小穗数、可育小穗数、粒长、粒厚、粒径比、有效穗数外,其它性状均表现为环境间极显著差异,而品质性状中,除籽粒蛋白质含量、籽粒硬度、低谷黏度和反弹值表现为环境极显著差异外,其它性状环境间没有达到极显著差异,说明环境对于农艺性状的影响大于品质性状;各性状的变异系数表现不同,穗下节间长、冬前分蘖、有效穗数、干面筋含量等9个性状的遗传变异系数超过20%,株高、旗叶长、籽粒硬度、穗长、穗粒数等22个性状的遗传变异系数在10%-20%之间,说明本研究群体在以上性状上具有比较丰富的遗传变异,利用现有种质资源对冬小麦产量及品质性状改良具有较大潜力。
2.关联定位群体遗传解析利用32,432个具有群体间多态性的SNP标记分型数据,对群体遗传多样性分析表明,标记多态性信息含量(PIC)范围是0.047-0.375,平均值为0.277,遗传多样性比较丰富。利用已定位且相互独立的3,852个SNP标记分型数据,进行群体结构和LD分析,结构分析表明,Structure聚类和NJ聚类结果基本吻合,均将该群体划分为4个亚群,具有相似亲缘关系的品种被聚为一类,说明亚群状况与系谱密切相关,而与来源地没有必然联系;LD分析表明,该群体的连锁不平衡衰减距离较短,全基因组LD平均衰减距离约2.0cM,A、B和D三个基因组的LD衰减距离分别为1.5、1.8和11.0cM,利用该群体全基因组关联作图精度较高。
3.最优关联模型选取应用TASSEL3.0软件,分别运行GLM、GLM_Q和MLM_Q+K三种统计模型进行性状与标记之间的关联分析,通过比较三种模型显著关联位点数目和Q-Q plot图中每一个SNP的P值期望值和实测值的吻合程度确定MLM_Q+K模型为该群体全基因组关联分析的最优模型。
4.复合遗传图谱构建根据6个DH遗传群体((1)BT-Schomburgk×AUS33384,(2)Young×AUS33414,(3)Chara×Glenlea,(4)W7984×Opata M85,(5)Sundor×AUS30604,(6)Westonia×Kauz)整合构建的遗传图谱,获得本群体具有品种间多态性的SNP位点信息,构建本群体的SNP标记高密度复合遗传图谱。遗传图谱包括24,355个SNP标记,共覆盖小麦全基因组3,674.16cM,单个染色体长度为118.91-241.38cM,标记间平均遗传距离为0.15cM。
5.全基因组关联分析利用该群体复合遗传图谱上的24,355个SNP标记对小麦40个农艺及品质性状进行标记/性状间全基因组关联分析。显著(P<0.001)水平下,四个或三个环境共检测到2511个标记/性状关联(Marker-trait association,MTA)位点,分布在小麦的21条染色体上。其中,极显著(P<0.0001水平)和相对稳定关联(至少在两个环境稳定表达)位点385个,贡献率>10%的主效位点115个。
(1)小麦农艺相关性状的关联分析四个环境下,5个株高相关性状共检测到263个显著关联位点,其中,极显著和相对稳定关联位点72个,主效位点71个,株高的2个极显著位点wsnp_Ra_c27787_37299352和BobWhite_c14066_403在四个环境表达,且贡献率均大于10%,为主效位点;穗下节长的3个位点和倒三节长的1个位点在三个环境表达。6个叶部相关性状共检测到519个位点,其中,极显著和相对稳定关联位点71个,主效位点13个,倒三叶长的1个位点在三个环境表达。5个穗部相关性状共检测到279个位点,极显著和相对稳定关联位点41个,主效位点5个。5个籽粒形态相关性状共检测到271个位点,极显著和相对稳定关联位点18个,粒长位点Ku_c9210_1059和千粒重位点BS00023893_51在三个环境表达。检测到抽穗期的94个位点,极显著和相对稳定关联位点19个,5D染色体上的位点RFL_Contig1091_1538在四个环境被重复检测到,且在E3环境表型大于10‰为主效位点。三个环境下,4个小麦分蘖相关性状检测到174个位点,极显著和相对稳定关联位点33个,主效位点4个。
(2)小麦品质相关性状的关联分析四个环境下检测到52个籽粒蛋白质含量的显著关联位点,其中,极显著关联位点5个,主效位点2个。检测到36个籽粒硬度显著关联位点,其中,极显著关联位点3个,主效位点1个,5D染色体上的BS00000020_51在四个环境表达。三个环境下检测到37个面粉蛋白质含量的显著关联位点,其中,极显著关联位点6个。检测到15个面粉灰分的位点,其中,3个位点(BS00025838_51、wsnp_CAP12_c2297_1121142和RAC875_c60191_114)为极显著关联位点。3个面筋相关性状检测到299个显著关联位点,其中,极显著关联位点30个,主效位点6个。检测到76个Zeleny沉淀值的显著关联位点,其中,极显著关联位点14个。淀粉糊化特性RVA的6个参数共检测到309个显著关联位点,其中,极显著关联位点70个,主效位点12个。关联分析结果的部分位点与前人连锁分析或关联分析定位的位点一致,进一步相互验证了实验结果的真实性。研究结果对重要区段QTL精细定位及分子标记辅助育种具有重要的参考价值。
6.获得多效性关联位点本研究发现了51个SNP标记同时与2个或多个性状相关联的多效位点。其中,染色体7A上标记wsnp_Ex_c14654_22713386同时和7个性状关联,4B染色体上标记Tdurum_contig4974_35和2A染色体上标记BS00022666_51同时关联6个性状。这些标记位点对小麦分子聚合育种具有重要意义,可作为以后研究的重点。
近年来,随着基因组学的发展和关联分析理论的不断完善,以连锁不平衡(Linkage disequilibrium,LD)为基础的关联分析(Association analysis)为动植物数量性状遗传的研究提供了新途径,它与基于连锁作图的数量性状位点(Quantitative trait locus,QTL)定位结果相互验证、相互补充。本研究从广泛收集的289份冬小麦材料中选取205份材料组成关联定位自然群体,利用小麦90K SNP基因芯片技术进行高通量基因分型,对自然群体进行遗传多样性、群体结构和连锁不平衡分析,并通过对GLM、GLM_Q和MLM_Q+K三种关联模型的比较分析,选取最适合的MLM_Q+K(Mixed Linear Model,混合线性模型)模型对小麦主要农艺及品质相关性状进行全基因组关联分析(Genome-wide association study,GWAS)。研究结果如下:
1.表型变异分析对关联定位群体40个农艺及品质性状的表型变异分析表明,农艺性状中除了倒三叶长、总小穗数、可育小穗数、粒长、粒厚、粒径比、有效穗数外,其它性状均表现为环境间极显著差异,而品质性状中,除籽粒蛋白质含量、籽粒硬度、低谷黏度和反弹值表现为环境极显著差异外,其它性状环境间没有达到极显著差异,说明环境对于农艺性状的影响大于品质性状;各性状的变异系数表现不同,穗下节间长、冬前分蘖、有效穗数、干面筋含量等9个性状的遗传变异系数超过20%,株高、旗叶长、籽粒硬度、穗长、穗粒数等22个性状的遗传变异系数在10%-20%之间,说明本研究群体在以上性状上具有比较丰富的遗传变异,利用现有种质资源对冬小麦产量及品质性状改良具有较大潜力。
2.关联定位群体遗传解析利用32,432个具有群体间多态性的SNP标记分型数据,对群体遗传多样性分析表明,标记多态性信息含量(PIC)范围是0.047-0.375,平均值为0.277,遗传多样性比较丰富。利用已定位且相互独立的3,852个SNP标记分型数据,进行群体结构和LD分析,结构分析表明,Structure聚类和NJ聚类结果基本吻合,均将该群体划分为4个亚群,具有相似亲缘关系的品种被聚为一类,说明亚群状况与系谱密切相关,而与来源地没有必然联系;LD分析表明,该群体的连锁不平衡衰减距离较短,全基因组LD平均衰减距离约2.0cM,A、B和D三个基因组的LD衰减距离分别为1.5、1.8和11.0cM,利用该群体全基因组关联作图精度较高。
3.最优关联模型选取应用TASSEL3.0软件,分别运行GLM、GLM_Q和MLM_Q+K三种统计模型进行性状与标记之间的关联分析,通过比较三种模型显著关联位点数目和Q-Q plot图中每一个SNP的P值期望值和实测值的吻合程度确定MLM_Q+K模型为该群体全基因组关联分析的最优模型。
4.复合遗传图谱构建根据6个DH遗传群体((1)BT-Schomburgk×AUS33384,(2)Young×AUS33414,(3)Chara×Glenlea,(4)W7984×Opata M85,(5)Sundor×AUS30604,(6)Westonia×Kauz)整合构建的遗传图谱,获得本群体具有品种间多态性的SNP位点信息,构建本群体的SNP标记高密度复合遗传图谱。遗传图谱包括24,355个SNP标记,共覆盖小麦全基因组3,674.16cM,单个染色体长度为118.91-241.38cM,标记间平均遗传距离为0.15cM。
5.全基因组关联分析利用该群体复合遗传图谱上的24,355个SNP标记对小麦40个农艺及品质性状进行标记/性状间全基因组关联分析。显著(P<0.001)水平下,四个或三个环境共检测到2511个标记/性状关联(Marker-trait association,MTA)位点,分布在小麦的21条染色体上。其中,极显著(P<0.0001水平)和相对稳定关联(至少在两个环境稳定表达)位点385个,贡献率>10%的主效位点115个。
(1)小麦农艺相关性状的关联分析四个环境下,5个株高相关性状共检测到263个显著关联位点,其中,极显著和相对稳定关联位点72个,主效位点71个,株高的2个极显著位点wsnp_Ra_c27787_37299352和BobWhite_c14066_403在四个环境表达,且贡献率均大于10%,为主效位点;穗下节长的3个位点和倒三节长的1个位点在三个环境表达。6个叶部相关性状共检测到519个位点,其中,极显著和相对稳定关联位点71个,主效位点13个,倒三叶长的1个位点在三个环境表达。5个穗部相关性状共检测到279个位点,极显著和相对稳定关联位点41个,主效位点5个。5个籽粒形态相关性状共检测到271个位点,极显著和相对稳定关联位点18个,粒长位点Ku_c9210_1059和千粒重位点BS00023893_51在三个环境表达。检测到抽穗期的94个位点,极显著和相对稳定关联位点19个,5D染色体上的位点RFL_Contig1091_1538在四个环境被重复检测到,且在E3环境表型大于10‰为主效位点。三个环境下,4个小麦分蘖相关性状检测到174个位点,极显著和相对稳定关联位点33个,主效位点4个。
(2)小麦品质相关性状的关联分析四个环境下检测到52个籽粒蛋白质含量的显著关联位点,其中,极显著关联位点5个,主效位点2个。检测到36个籽粒硬度显著关联位点,其中,极显著关联位点3个,主效位点1个,5D染色体上的BS00000020_51在四个环境表达。三个环境下检测到37个面粉蛋白质含量的显著关联位点,其中,极显著关联位点6个。检测到15个面粉灰分的位点,其中,3个位点(BS00025838_51、wsnp_CAP12_c2297_1121142和RAC875_c60191_114)为极显著关联位点。3个面筋相关性状检测到299个显著关联位点,其中,极显著关联位点30个,主效位点6个。检测到76个Zeleny沉淀值的显著关联位点,其中,极显著关联位点14个。淀粉糊化特性RVA的6个参数共检测到309个显著关联位点,其中,极显著关联位点70个,主效位点12个。关联分析结果的部分位点与前人连锁分析或关联分析定位的位点一致,进一步相互验证了实验结果的真实性。研究结果对重要区段QTL精细定位及分子标记辅助育种具有重要的参考价值。
6.获得多效性关联位点本研究发现了51个SNP标记同时与2个或多个性状相关联的多效位点。其中,染色体7A上标记wsnp_Ex_c14654_22713386同时和7个性状关联,4B染色体上标记Tdurum_contig4974_35和2A染色体上标记BS00022666_51同时关联6个性状。这些标记位点对小麦分子聚合育种具有重要意义,可作为以后研究的重点。