论文部分内容阅读
野生大麦(Hordeum vulgare ssp.spontaneum)是栽培大麦(Hordeum vulgare ssp.vulgare)的祖先,因其丰富的遗传多样性及其与栽培大麦无生殖隔离而被认为是栽培大麦性状改良的初级基因库。大麦的驯化传播一直是学术界的热点问题之一,至今仍然存在争议。本研究通过对9份近东野生大麦(Wb-NE)、10份中国西藏野生大麦(Wb-T)和10份中国栽培大麦(Cb-C)种质进行转录组和代谢组联合分析,解析中国大麦的起源及进化过程中代谢物分化的分子机制,主要结果如下:1.通过对29份大麦种质转录组测序和质控,共获得185.60 Gb Clean reads。通过变异检测,共获得1,182,394个SNPs,再经过滤后获得176,741个高质量的SNPs。基于该SNPs集对3个大麦群体进行遗传多样性评估,结果表明Wb-NE遗传多样性最高(π=0.23036,θW=0.21255,MAF=0.1745及PIC=0.2176);其次为Wb-T,而Cb-C的遗传多样性最低。PCA、群体结构分析及系统进化树的结果也表明,栽培大麦和野生大麦之间存在明显的遗传分化。同时,Wb-NE位于有根进化树的基部,与球茎大麦最早发生分化(在第1节点);之后Wb-T从Wb-NE中分化出来(在第2结点);最后,Cb-C从Wb-T中分化出来(在第3结点)。这些结果表明中国栽培大麦的进化历程可能是由Wb-NE到Wb-T最后到Cb-C,且在进化过程中存在基因流现象。2.通过对3个群体的同源片段追溯(IBD)和ABBA-BABA统计分析,结果在Wb-T群体和Cb-C群体内分别检测到30对和16对种质共享相同单倍型,而在Wb-NE群体内仅检测到3对共享相同单倍型。Wb-NE中HS26和HS56两份种质与其他种质均没有共享相同的单倍型,代表了最原始的基因组状态,支持了大麦近东起源理论。此外,ABBA-BABA统计结果得出三个树形拓扑结构模型,其中(((Wb-T,Cb-C),Wb-NE),HS18)模型为最佳树形拓扑结构,该模型的D statistic为0.1679,Z score为6.021,表明Wb-NE与Cb-C存在基因流现象。其余的两个模型均表明Wb-T与Cb-C也存在基因流现象。3.基于25份大麦种质的114,120个SNPs对3个群体的基因组相似性分析表明,Wb-T与Cb-C组、Wb-NE与Cb-C组之间的相似性基因组窗口分别为560个和281个,而Wb-T与Wb-NE组之间的相似性基因组窗口最多,为659个。此外,通过观察相似性窗口在染色上的分布情况,发现相比于Wb-NE与Cb-C组,Wb-T与Cb-C组在7条染色体均明显更多,特别在1H、4H、7H染色上高达2~3倍。同时,Wb-NE与Wb-T组平均π比值为1.0455,平均ROD值为-0.0455;而Wb-T与Cb-C组平均π比值为0.8708,平均ROD值为0.1292。以上结果表明,Wb-NE与Wb-T之间遗传相似性最高而遗传分化程度最低,此外与Wb-NE相比,Wb-T对Cb-C具有更高的基因组贡献度。通过Fst>0.5对两个进化过程受选择基因进行筛选及KEGG注释,在Wb-NE与Wb-T组中共注释到261个受选择基因;在Wb-T与Cb-C组中注释到1390个受选择基因。4.结合代谢组分析在25份种质中共检测到8828个非冗余代谢物,其中包括328个注释的代谢物。所有代谢物的PCA与聚类分析表明,从Wb-NE到Wb-T及Wb-T到Cb-C的两个进化过程中发生了代谢物的分化。在Wb-NE到Wb-T和Wb-T到Cb-C进化过程中分别有1850个代谢物(55个被注释)和2766个代谢物(108个被注释)受到强烈选择。且所有被注释的受选择代谢物在两个进化过程中表现出3种进化特征。第一种是仅在Wb-NE到Wb-T传播过程中受选择的生物碱类(N-Methyltyramine及Hordenine)代谢物;第二种是在两个进化过程中均受选择的代谢物;第三种是仅在Wb-T到Cb-C驯化过程中受选择的苯丙烷类(L-Phenylalanine、4-Hydroxycinnamic acid及Apiin)代谢物。5.结合受选择的基因分别对两个进化过程中表现出特异分化的代谢物进行遗传机制研究,结果表明在Wb-NE到Wb-T进化过程中有5个受选择的基因参与到N-Methyltyramine与Hordenine的合成途径,其中在HORVU6Hr1G027650基因的编码区发现了8个同义突变和5个错义突变。这5个错义突变位点可能是导致该进化过程生物碱类代谢物发生分化的关键变异位点。在Wb-T到Cb-C进化过程中也有5个受选择的基因与Phenylalanine、p-coumaric acid及Apiin密切相关,其中在HORVU4Hr1G072150基因的编码区发现了2个同义突变和4个错义突变。这4个错义突变可能是导致该进化过程中苯丙烷类代谢物发生分化的关键变异位点。