论文部分内容阅读
获得与缺失变异(Presence/Absence Variants,PAVs)是一类由DNA片段的缺失和插入引起的基因组结构变异。根据缺失或插入的DNA片段的大小,PAV分为小片段PAV(Small-size PAV,ss PAV)(40 bp-10 kb)和大片段PAV(Large-size PAV,ls PAV)(>10 kb)。与单核苷酸多态性(SingleNucleotide Polymorphisms,SNPs)及小片段插入缺失(Insertions and Deletions,InDels)相比,PAVs在基因组中发生的频率较低,但PAVs所影响到的基因组序列大小和基因数目却远高于它们,是基因组结构变异和表型变异的重要来源。研究表明,PAVs广泛存在于人类及动植物基因组中。目前,PAVs在人类基因组中已有所研究,但在植物中的研究报道仍相对较少。 高粱(Sorghum bicolor)是目前世界上重要的粮食、饲料与能源作物,且具有抗旱、耐盐碱、耐涝和耐寒等特性。尽管如此,高粱的遗传研究和改良仍远落后于玉米、水稻和小麦等作物。本研究深度分析重测序数据,发掘PAV标记,利用重组自交系(Recombinant Inbred Lines,RILs)构建遗传连锁图谱,并应用于重要农艺性状进行了QTL定位。主要结果如下。 本研究对三个高粱品种(Ji2731,E-Tian和Keller)的重测序所得到的5511个基因的小片段获得与缺失变异(Genie Small-size PAVs,gss PAVs)的分布和功能等特征进行了分析,并利用PCR方法进行了PAVs的实验验证。在1466个PCR结果中,有1142(77.9%)个PCR结果与重测序的结果一致。研究结果显示,5511个PAVs在不同染色体上的分布差异明显,其中,1号染色体分布最多,共有770(14.0%)个PAVs,7号染色体分布最少,共有328(6.0%)个PAVs,而5号、6号、8号和9号染色体上发生PAVs的概率较高,约为每15.7-16.1个基因发生一个PAV。对于单条染色体,染色体的两臂聚集了大部分的PAVs,而在染色体的着丝粒及其附近的区域分布较少。在基因中,我们发现PAVs更倾向于非翻译区,其次是编码区,最后是内含子区。通过分析PAVs的序列特征,发现3742(67.9%)个PAVs包含有7532个转座元件(Transposable Elements,TEs),逆转录转座子和DNA转座子占据了大部分的TEs,分别为5280个和2227个,而未分类的转录元件只有25个。对PAVs影响的3238基因进行功能富集和Pfam分析,发现PAV基因功能主要与抗病相关,而且这些抗病功能的PAV基因大多是通过信号转导和蛋白修饰的途径发挥作用。 根据PAVs在两个高粱品种Ji2731和E-Tian之间的多态性,我们选取了360个PAVs发展为分子标记。利用这些分子标记对209个Ji2731 x E-Tian的F2群体中的植株进行基因型扫描,构建了总长为1430.2 cM的遗传图谱。该图谱由325个PAV分子标记和49个SSR分子标记组成,包含10条连锁群,分别对应高粱的10条染色体。标记间的平均距离为3.83 cM,覆盖了640.4 Mb的物理距离,约占高粱基因组的97%。基于此图谱,我们对在中国和丹麦种植的3个群体的23个性状进行了QTL定位。结果共获得了64个QTLs(LOD≥3.0),这些QTLs分布在10条连锁群上,LOD值的范围为3.0-20.5,解释率(r2)为5.1-37.5%。其中,16个QTLs同时定位在中国和丹麦的种植群体中,18个QTLs在至少两个条件下被检测到。 综上所述,本研究对高粱基因组内的gss PAVs进行了分布、序列特征及功能的研究,并构建了高粱的PAV标记遗传图谱。同时利用此图谱完成了不同地区种植的高粱群体的重要农艺学性状的QTLs定位,为高粱的分子育种和遗传改良提供了新的研究手段。