论文部分内容阅读
棉花是世界上重要的天然纤维和油料作物。完成棉花的基因组测序及密码解析将为棉花的遗传改良提供重要的数据资源和平台,有助于科研人员从分子水平上更深入的了解棉花纤维的生长、发育机理,并对棉花新品种的培育及提高棉花的产量、品质和抗病性等具有重要的战略意义。陆地棉TM-1是异源四倍体棉。异源四倍体棉种(AADD)是由A亚组和D亚组组成的,基因组比较大、重复序列高以及部分同源染色体基因组结构复杂的特征揭示着四倍体基因组的测序难度大。基于细菌的插入大片段克隆的全基因组物理作图,已经成为基因组研究中非常活跃的领域。DNA指纹图谱对于基于细菌的大片段插入克隆的大规模分析和产生基于克隆的全基因组物理图谱,已被证明是有效的方法。DNA指纹图谱与细菌中DNA大片段克隆技术相结合,已经成为利用插入大片段克隆进行全基因组物理作图研究中最为广泛使用的方法。
棉花的物理图谱是基因组研究的基础,它不仅在研究基因组组织结构和棉种的起源进化方面具有重要的理论和应用价值,对棉花基因组的测序,重要基因的图位克隆以及大范围的基因组分析也有重要意义。绘制高分辨率的物理图谱是进行测序工作的保证。本研究以陆地棉遗传标准系TM-1的BAC文库及高密度遗传图谱为基础,进行了陆地棉TM-1第12部分同源染色体重叠群构建,旨在为重要功能基因的图位克隆和棉花基因组测序提供强有力的框架图。主要研究结果如下:
1、陆地棉A12和D12染色体是比较重要的一对部分同源染色体,目前许多与重要农艺性状相关的基因已被定位在这两条染色体上如无腺体基因(gl2,gl3),纤维有无基因(N1,Fb1,n2),核不育基因(ms5,ms6),致死基因(Le1,Le2)等。为了图位克隆这些重要的农艺性状相关的基因,需要构建这两条染色体的物理图谱。以本实验室的高密度遗传图谱A12染色体上的54对标记和D12染色体上的48对标记进行TM-1BAC文库的筛选,A12染色体上25对标记筛到了216个阳性单克隆,D12染色体上18对标记筛到了189个阳性单克隆,筛选到的阳性单克隆总数为405个。各个标记筛到的阳性单克隆数从1到22个。结合本实验室原有的基础381个阳性单克隆,将686个阳性单克隆进行纯化和BAC质粒DNA的提取,进行HindⅢ酶切,利用琼脂糖方法进行酶切指纹图谱的分析,通过Image3.10b软件对琼脂糖图片进行分析,A12染色体上得到了387个单克隆的5,372条带,D12染色体上得到了388个单克隆的4,843条带,所获得的bands文件通过FPCV9.3软件的分析,将A12染色体的BAC单克隆和D12染色体的BAC单克隆分开构建了A12和D12染色体的重叠群。其中A12染色体的各个引物的重叠群有77个,其contig长度在53-155kb之间,连续的contig有4个,大小在277kb-5,007kb之间;D12染色体上各个引物的重叠群有82个,其contig长度在61-119kb之间,连续的重叠群有7个,大小在81kb-2,407kb之间。
2、多倍体植物测序的难点是如何有效的将部分同源染色体区分开来。针对这一难点,我们选取了极具代表性的7组A12染色体和D12染色体共有的标记:NAU2715-180和NAU2715-250, NAU3441-230和NAU3441-180, NAU1151-160和NAU1151-170, NAU3293-180和NAU3293-150, NAU2251-165和NAU2251-155,NAU1237-255和NAU1237-150,NAU2356-150和NAU2356-170。由于异源四倍体棉种是由A亚组和D亚组组合而成的,因此在利用这7组引物扩增时通常会出现两个等位位点,即在海岛棉Hai7124和陆地棉TM-1中均产生两个等位位点。A12和D12染色体存在有共有标记,这证明了两条染色体部分同源,而A12和Dt2染色体上的共有标记能够筛选到相同的单克隆进一步的说明了A12和D12染色体部分同源,因此进行阳性单克隆的重叠群组装前必须进行A12和D12染色体的区分,将来源于A12和D12染色体的单克隆区分开构建重叠群。7组标记所共有的阳性单克隆进行目标引物的PCR扩增,根据带型来进行A12和D12染色体的区分,其中来源于NAU2715-180(A12)的单克隆有3个,NAU2715-250(D12)的单克隆有6个;来源于NAU3441-230(A12)的单克隆有4个,NAU3441-180(D12)的单克隆有12个;来源于NAU1151-160(A12)的单克隆有2个,NAU1151-170(D12)的单克隆有2个;来源于NAU3293-180(A12)的单克隆有1个,NAU3293-150(D12)的单克隆有4个;来源于NAU2251-165(A12)的单克隆有1个,NAU2251-155(D12)的单克隆有3个;来源于NAU1237-255(A12)的单克隆有3个,NAU1237-150(D12)的单克隆有4个;来源于NAU2356-150(A12)的单克隆有10个,NAU2356-170(D12)的单克隆有6个。对这些单克隆进行酶切指纹图谱分析,分开构建了A12和D12染色体上相应的标记的contig,其中NAU1151 A12和D12染色体上的contig长度分别是94kb,73kb; NAU1237 A12和D12染色体上的contig长度分别是102kb,73kb; NAU2356 A12和D12染色体上的contig长度分别是159kb,111kb; NAU2715 A12和D12上的contig长度分别是77kb,131kb; NAU3293 A12和D12染色体上的contig长度是77kb和45kb; NAU3441 A12和D12上的contig长度分别是86kb,90kb; NAU2251A12和D12上的contig长度是41kb和81kb。
3、棉花基因组具有丰富的BAC文库资源,是棉花基因组测序分析所必不可少的重要基础。不同的参数得到的重叠群的结果是不同的,大量的BAC单克隆聚集在一起做重叠群的组装分析所得到的结果不准确。我们将A12和D12染色体的BAC单克隆区分开来,分开构建出A12的1个重叠群和D12的1个重叠群;同样将这些来源于A12和D12染色体的BAC单克隆混合在一起,采用FPC软件推荐的默认参数设置,把原来分属2个重叠群的BAC单克隆能够错误地组装成1个重叠群。很显然,采用低的参数设置所得到的重叠群有时是错误的,是由分别来源于A12和D12部分同源染色体的单克隆聚集在一起组装成的。因此本研究提出了在做棉花部分同源染色体的重叠群构建工作时所采用的适宜的参数,为今后利用BAC资源进行棉花基因组测序分析提供一种新的参考方法。公差值(Tolerance)的设置能够告诉FPC两条被认为是匹配的条带的接近程度。截止点(Cutoff)的设置是用来控制两个必需结合成为一个毗连群的克隆应该有多少重叠部分。通过对FPC软件的Tolerance值和Cutoff值进行优化设置,以达到有效区分A12染色体上单克隆构成的contig和D12染色体上的单克隆构成的contig。将7组标记所对应的BAC单克隆混合在一起进行重叠群的组装,Tolerance=5或6,Cutoff值=1e-12,Tolerance=7,8或9,Cutoff值=1e-11或1e-12,6组标记(NAU1151,NAU1237,NAU2715,NAU2251,NAU3293,NAU2356)分开构建了A12和D12染色体上的contig,Tolerance=10,Cutoff值=1e-11,5组标记(NAU1151,NAU1237,NAU2715,NAU2251,NAU2356)分开构建了A12和D12染色体上的contig: Tolerance=10,Cutoff值=1e-12,6组标记(NAU1151,NAU1237,NAU3441,NAU2251,NAU3293,NAU2356)分开构建了A12和D12染色体的contig。
参数设置的过低并不能区分开A12和D12的contig,参数设置的过高,有的单克隆会从contig上消失,因此,最低设置是Tolerance=7,Cutoff值应该选择1e-11。进行如上的调整能有效区分A12和D12染色体上的单克隆构成的contig。