论文部分内容阅读
拟南芥是一种被广泛应用的模式植物,被称为“植物中的果蝇”,随着分子生物学技术的逐步发展,越来越多的拟南芥功能基因或变异位点被挖掘出来,并应用于农作物的耐逆性、高产性育种。遗传分子的变异是造成生物间差异的根本原因,不同生态型的生物个体往往能展现出不一样的环境适合度,而探索遗传分子变异的环境适应性及作用机制成为当前功能基因组学研究的重要组成部分。在拟南芥中,1001基因组团队检测了超过1000个拟南芥生态型的全基因组序列。基于此,已有部分研究分析了拟南芥的DNA编码区变异的环境关联性与功能,并新发现了一些抗逆性或环境适应性的功能性基因或位点。然而,目前还没有系统全面的针对非编码区变异的分析,这明显不符合DNA非编码区的重要生物学地位。为此,本研究以拟南芥DNA非编码区中的调控区为研究对象,展开了基因表达关联性、环境因素关联性、区域分化关联性等分析,并进一步探索了非编码区变异的生物功能与遗传机制。简单概括,基于1001基因组的拟南芥泛基因组数据,我们筛选得到321,194个Motif区域的非罕见变异位点。eQTL分析结果显示了5,771个顺式调控关系(cis-eQTL),其中3,663个变异与2,068个基因的表达呈正关联,2,267个变异与1,356个基因的表达呈负关联。接着,我们利用混合线性模型进行DNA调控区的环境关联分析,结合eQTL数据与Motif扰乱分析,进一步筛选出41个同时具有环境关联性,基因表达关联性以及Motif扰乱性的变异位点,这对局部适应性形成的分子机制研究具有重要意义。同时,我们还展开了调控区变异的共出现分析,发现了广泛存在的变异间协同效应。然后,我们对气候环境差异显著的意大利与瑞典拟南芥种群进行了分歧进化研究,鉴定到206个DNA调控区的变异位点显著关联到拟南芥的趋异进化,并发现了1号染色体对该趋异进化过程可能起到更重要的作用,此外,基于DNA调控区变异的系统进化分析显示,意大利与瑞典的拟南芥在分子水平上确实存在明显的分歧进化,且亚群内部也有一定的分化现象,而温度类生物气候因素可能是亚群形成的主要成因。最后,基于1001基因组的数据,我们对拟南芥群体样本开展了多组学关联分析,在全基因组范围内鉴定了莲座叶中所有的eQTL位点、环境关联的eQTL位点、GWAS关联的eQTL位点、emQTL位点、pathway-mQTL位点以及pathway-phenotype关系,并进行了全转录组关联分析(TWAS)与表观基因组关联分析(EWAS)。通过应用多组学关联网络,我们新发现了两个潜在的开花相关基因,并揭示了其潜在的分子遗传机制。总体而言,本研究基于拟南芥群体样本的多组学关联分析策略,分析了DNA调控区变异的基因表达关联性、环境因子关联性、区域分化关联性等。结合转录组差异表达分析、Motif结合能力分析以及环境差异分析,我们对关联位点进行了精准定位,找出了潜在的致因性位点,探索了拟南芥的局部适应性(Local adaptation)、趋异适应性的遗传分子机制,挖掘了抗逆性、环境适应性等相关的基因或位点。所有的结果将为研究植物适应性进化机制以及挖掘耐逆性、适应性相关的基因或位点提供重要的理论依据与探索方向。