论文部分内容阅读
近年来,棉花基因组研究已取得了重大进展,包括海量分子标记的开发、高密度遗传图谱与高分辨率细胞遗传图谱的成功构建、转录组测序的深入开展以及二倍体雷蒙德氏棉(DD,2n=26)、亚洲棉(AA,2n=26)全基因组测序的相继完成。但是,针对棉花复杂的基因组结构与组成,仍有众多问题亟需解决,如棉花部分同源染色体结构差异的形成及动因,着丝粒序列及其遗传与物理定位等。针对上述问题,我们采用分子细胞遗传学技术与生物信息学相结合的方法进行了三个方面的探索。首先,在原有分子细胞遗传学技术基础上成功构建了适用于棉花的DNA纤维荧光原位杂交技术(DNA fiber fluorescence in situ hybridization, DNA fiber-FISH);其次,结合高分辨率分子细胞遗传图谱,进一步在DNA序列水平上对陆地棉(AADD,2n=52) 12A和12D部分同源染色体的结构差异进行了分析;再次,发掘出棉花着丝粒相关的反转录转座子,并在物理图谱及遗传图谱上将棉花的着丝粒位置进行了标定。主要研究结果如下:1.棉花DNA fiber-FISH技术的建立与应用棉花富含酚类、糖类和脂类等次生物质,干扰细胞核的分离与DNA纤维的制备,导致常规的植物fiber-FISH技术无法直接应用。针对这些问题,我们通过探索建立了适用于棉花的DNA fiber-FISH技术,并以端粒及5S rDNA为例进行了系统的应用分析,证明了该方法在棉花中的可行性与可靠性。2.陆地棉12A和12D部分同源染色体的结构比较分析高分辨率细胞遗传图谱研究显示,陆地棉12A和12D部分同源染色体结构差异在不同区域并非一致。为了从DNA序列水平上探讨染色体结构差异的因素,我们选择染色体末端以及着丝粒区域的BAC克隆进行了测序分析。序列比对分析显示:部分同源染色体12A和12D的末端存在高度保守序列,但其着丝粒区域存在高度变异序列。进一步的分析显示,着丝粒区域形成的巨大差异与内含子长度变异及小片段indel的关联性很小,主要是Gorge3类反转录转座子的不均衡积累引起的,为棉花基因组结构差异的研究提供了重要参考。3.棉花着丝粒相关序列的发掘与鉴定我们鉴定出一个棉花着丝粒特异BAC克隆,将其测序并进行序列分析。经FISH验证后,鉴定出四个棉花着丝粒相关的LTR反转录转座子,即GhCR1、GhCR2、GhCR3和GhCR4,统称为GhCRS。fiber-FISH分析显示,GhCRs呈现成簇相间分布。将GhCRs作为待查序列,在四倍体陆地棉TM-1基因组上进行序列比对,明确了棉花基因组着丝粒的所处区间。通过标记搜寻,进一步明确了位于着丝粒区域的SSR标记,从而在遗传图谱上定位了着丝粒区。