论文部分内容阅读
棉花是世界主要的纺织作物,也是一个用于研究许多生物学过程的模式系统。棉花基因组学的研究在过去的几年里得到了迅速的发展。棉花叶绿体基因组研究随着基因组学和基因组测序的发展而逐渐深入;目前,解释叶绿体功能和叶绿体与其他细胞器的联系的蓝图已经初现端倪。棉属包含5个四倍体种(AD1到ADs,2n=4×)和47个二倍体种(从A到G、K,2n=2×),但棉花异源四倍体的起源与进化仍有争议。为了进一步理解这一重要的农作物并解决相关进化问题,我们对3个棉种的叶绿体基因组开展研究。主要结果如下:1.本实验测定和注释了3个二倍体棉种完整的叶绿体基因组序列。生物信息学分析表明,棉花叶绿体基因组是高度保守的。这3个棉种的叶绿体基因组像其他大多数高等植物的叶绿体基因组一样是典型的环状结构,包括1个大单拷贝区(LSC)、1个小单拷贝(SSC)和2个反向重复区域(IR)。整个基因组大小一次是159945bp (G.laxum; D9)、159973bp (G. turneri;D10)和160122bp(G. shwendimanii; D11)。这3个棉种叶绿体基因组的大小差异主要来源于IGS的长度变化。每个基因组包含140个基因,包括113功能基因(79个编码蛋白质的基因、30tRNA和4rRNA基因),2个ORFs,4个假基因和21重复基因。与前人研究相比,新注释了4个基因:infA,ycf68,ORF42和ORF56。叶绿体基因顺序与烟草叶绿体基因顺序一致,这表明并不存在重新排列。3个棉种叶绿体基因组的GC含量分别为为37.27%(G. laxum; D9)、37.27%(G. turneri; D10)和37.25%(G. shwendimanii;D11),与其他植物相似。2.这3个棉种叶绿体基因组SSRs的数量从62到64,平均为0.36SSRs/kb.我们定义单核昔酸≥8bp为重复单核苷酸,3个叶绿体基因组中主要的单核苷酸重复为A或T,占94.85%到97.28%,SSR位点区域的A、T含量也较高。本研究中获得的数据表明棉花的叶绿体基因组的SSR多态性非常丰富,且其数量将连同SSR长度或SSR修饰的加长而递减。3.结合其它11个棉种分析显示,IR区的扩张和收缩在14个棉种的进化中是非常普遍的。在IR/SSC/LSC边界观察到的IR的扩张与收缩可能是两个短重复序列分子重组引起的,这两个短重复序列经常被定位在基因的边界。4.基于叶绿体基因组50个共同蛋白编码基因,本文进行了41个被子植物和4个裸子植物(苏铁、银杏、松属和买麻藤)的系统发育分析。确定了棉属的进化位置,证实了在双子叶植物中可可(Theobroma cacao)是与棉花亲缘性最近的植物。系统发育的3种方法[maximum-likelihood (ML), maximum parsimony (MP)和neighbor-joining (NJ)]分析数据表明,方法对于进化树的构建没有很大影响,因为3种方法的拓扑结构基本一致。用这3种方法构建14个棉种的系统发育树其结果也很相似。