论文部分内容阅读
棉花是世界上最主要的天然纤维来源,也是重要的油料作物。其中陆地棉产量最高,占世界棉花总产量的90%,海岛棉占5-8%。通常认为亚洲棉(A基因组)和雷蒙德氏棉(D基因组)是异源四倍体棉种的两个供体。虽然在棉花中已经进行了很多SSR标记鉴定和引物开发的研究,但由于缺少完整的参考基因组序列,SSR在棉花基因组中的分布仍然不明确,这限制了 SSR标记在棉花基因组研究和分子标记辅助选择育种中的应用。作物中的自然变异主要来源于野生祖先种的自然选择和人工选择,能够适应各种不同环境条件的棉花品种是棉花遗传改良的宝贵资源。我国作为世界上重要的纺织品生产国和消费国,棉花产业在我国国民经济中发挥着无可替代的作用。除了经济价值,陆地棉也是研究多倍化、植物细胞伸长和纤维素合成的模式系统。但是陆地棉的遗传多样性和在品种改良过程中发生的遗传变异并不清楚。随着棉花参考基因组序列的完成,利用高通量基因分型技术可以快速和准确地对大量棉花品种进行重测序,检测棉花表型变异的遗传基础,开展棉花复杂性状的全基因组关联分析和进化研究。理解棉花表型变异的遗传基础和棉花的驯化过程,可以帮助我们更加有效地利用这些多样性的种质资源进行棉花品种改良。本研究首先利用陆地棉、亚洲棉和雷蒙德氏棉的基因组序列开发SSR标记,比较SSR在不同基因组间的分布频率并进行全基因组引物设计,筛选出海陆多态性引物。然后选取了 318份棉花材料组成自然变异群体进行全基因组重测序,检测SNP位点,分析群体遗传多样性,包括全基因组核苷酸多样性指数(π)、遗传分化指数(Fst)和基因组选择消除分析,揭示棉花的遗传多样性,以及从地方品种到现代栽培品种的改良过程中基因组的进化。最后进行产量、纤维品质和抗黄萎病等重要性状的全基因组关联分析,发掘优异等位变异。主要结果如下:在陆地棉基因组及其供体二倍体棉种亚洲棉和雷蒙德氏棉基因组中分别鉴定出100290,83160和56937个SSR,他们在各自基因组中分布的频率分别为41.2,49.1和74.8个SSR每Mb。在TM-1、亚洲棉和雷蒙德氏棉基因组中设计出77996、63263和44388对SSR引物,分别占三个基因组中鉴定出SSR标记的83.2%、81.46%和82.8%。这些SSR在基因组中并非随机分布,而是与基因的分布成正相关,与TE的分布成负相关。利用在陆地棉基因组中鉴定的100290个SSR,开发了 77996对SSR引物,其中65498对位于棉花的26条染色体上,频率为34对每Mb。这些引物中有7705对是新开发的引物并且位于基因区,占所有引物的9.9%。利用电子PCR(in silico PCR)的方法评估了这些引物在三个基因组中的多态性,并随机挑选出505对引物进行了 PCR验证。另外鉴定出在陆地棉TM-1和海岛棉Hai7124间具有多态性的引物共有8825对。这些SSR标记在棉花遗传图谱构建、基因组进化和比较基因组等研究中具有重要意义。通过对318份棉花地方品种和现代栽培品种的全基因组重测序,鉴定出8621073个SNP,密度为每Kb序列4.41个SNP。选取最小等位基因型频率(MAF)大于0.05的SNP,共得到2167186个共同SNP进行后续分析。位于基因区的SNP有190949个,其中66138个位于编码区域,包括745个基因中的769个非同义突变(stop codons gain/loss和exon-intron splice)SNP。调查了棉花现代栽培品种改良的遗传基础,并进行了群体遗传多样性分析和重要性状的全基因组关联分析。遗传多样性分析显示,棉花地方品种和现代栽培品种间的遗传分化指数Fst值为0.04,比半野生种和栽培品种间的Fst值(0.10)低。同时地方品种的核苷酸多样性指数π值(2.59×10-4)比现代栽培品种的n值(1.79×10-4)高。通过比较地方品种和现代栽培品种的核苷酸多样性指数,鉴定出25个棉花改良过程中的选择信号。从318份材料中选取258个品种进行GWAS分析,共鉴定出119个关联位点,其中产量相关的关联位点71个,纤维品质相关的位点45个,还有3个位点与黄萎病抗性相关。其中产量性状关联到的位点更多,表明产量性状可能在改良过程中受到更多的选择。鉴定出两个乙烯途径相关的基因与产量性状关联。最后选取十个棉花品种进行IBD(Identity-by-descent)分析,研究棉花优异等位变异的传递和演化。这些结果为棉花的改良和多倍体作物的进化研究奠定了理论基础。