论文部分内容阅读
稻族(Oryzeae)是禾本科中包含重要粮食作物,包括亚洲栽培稻Oryzasativa和非洲栽培稻O.glaberrima的重要类群,现有大约12个属,广布于全球的热带和温带地区,世界大约一半的人口以水稻为食。本研究从稻属-AA基因组物种的二代测序数据中提取线粒体reads,完整地拼接出稻属-AA基因组的9个线粒体基因组;同时还用基因组reads、从头组装出的基因组序列和实验验证结合检测了26个重要的农艺性状相关基因在稻属-AA基因组8个种中得到与丢失的分布式样,还用日本晴(JAP)核基因组为参考,分析了PROG1基因同源区段的结构与变异。最后,还对大理茶(C.taliensis)和油茶(C.oleifera)的2个叶绿体基因组序列进行组装和分析。主要结果如下: 1.稻属-AA基因组物种线粒体基因组的比较分析 对稻属-AA基因组9个线粒体基因组和56个其它植物线粒体基因组分析发现:(1)本研究从头组装的9个线粒体基因组大小分别为400,745 bp(O.staivassp.indica,IND)、490,521 bp(O.sativa ssp.tropical japonica,TRJ)、529,440 bp(O.rufipogon,RUF)、437,681 bp(O.nivara,NIV)、460,533 bp(O.barthii,BAR)、432,444 bp(O.glaberrima, GLA)、468,723 bp(O.glumaepatula,GLU),413,739 bp(O.longistaminata,LON)和426,128 bp(O.meridionalis,MER)。这些线粒体基因组包含35个基因,大部分都保持1个拷贝。9个线粒体基因组都包含3个rRNA基因(rrn5、rrnL和rrnS),而tRNA在各个种中分布式样不同。平均G+C%含量为43.9%;(2)4个JAP线粒体基因组的共线性最好,平均长度为491Kb左右;变化最大的为IND的6个线粒体基因组。IND和IND NC007886的共线性是6个IND中共线性最好的2个,其余4个在重复序列的位置,重复序列的多少都有明显的变化。在18个线粒体基因组中,除NIV在266,037 bp到284,583bp发生18,546 bp的倒位,其余17个线粒体基因组主要发生频繁的序列重排;(3)9个线粒体与JAP核基因组的同源序列比例最高,平均值为75.50%。在JAP的第12号染色体上与线粒体同源的序列最多,平均长度为228 Kb,占整个线粒体基因组长度的一半左右。在JAP第12号染色体上包含的基因也最多,从15到17个不等,在第11号和5号染色体上未发现线粒体基因。水稻线粒体35个基因共有22个与核基因组存在同源,占线粒体基因的62.86%。3个rRNA基因有2个与核基因组同源,占线粒体rRNA基因的66.67%;(4)在LON中检测到4个ORF嵌合体可能与CMS相关。这4个ORF都包含atp6(171 bp~205 bp)长度为35 bp的序列,其余5个可能的CMS ORF还需进一步验证;(5)TRJ重复序列比例最大,占44.49%。16个禾本科线粒体基因组与重复序列大小呈中等程度相关,稻属AA-基因组物种9个线粒体基因组大小和重复序列呈极强相关;(6)稻属AA-基因组物种9个线粒体基因组的基因中,RNA编辑位点最多的为细胞色素C合成酶基因,复合体Ⅰ类基因中RNA编辑次之,最少的为核糖体亚基RNA。 2.水稻农艺性状相关基因在稻属AA-基因组物种中的得到与丢失式样 本研究分析了水稻26个重要的农艺性状基因在稻属-AA基因组8个种中的分布式样,分析结果发现:(1)26个基因在IND、TRJ、RUF、NIV和GLU中都存在,GW5基因在LON和MER丢失;PROG1基因在BAR,GLA和MER丢失;GS3基因在BAR和GLA中丢失;(2)对PROG1基因同源区段注释和分析后推测GLA、BAR和MER中PROG1基因的丢失可能与PROG1基因左边的DNA转座子有关,PROG1基因所在的12,697 bp区段在GLA、BAR和MER中丢失;GLU和LON中的PROG1基因有别于PROG1和prog1单倍型,GLU、LON、RUF和NIV这4个种的PROG1基因在进化历史上先经过纯化选择作用,然后GLU/LON和RUF/NIV分别受到正选择作用;(3)对PROG1基因279Kb左右的同源区段分析发现,JAP和NIV的长度比GLA(BAR)分别增加了79Kb和53 Kb左右,在JAP和NIV中LTR-gypsy家族的转座子最多,长度分别为22,020 bp和21,588 bp,推测该区段的LTR-gypsy家族与该同源区段长度的增加可能相关。 3.茶树叶绿体基因组的分析 用二代测序技术对大理茶和油茶叶绿体基因组进行测序,完整组装与比较分析发现:(1)大理茶和油茶的叶绿体基因组大小比较保守,C.taliensis基因组大小为157,153 bp,C.oleifera基因组大小为156,971bp,G+C%含量为37%左右。C.taliensis和C.oleifera的基因数为133个,19个基因出现在IR区。在剩余的114个基因中,有15基因包含1个内含子,有2个基因包含2个内含子。基因序列占整个编码区的51.3%。在C.taliensis的LSC和SSC区,长度都大于C.oleifera,而C.oleifera的IR区大于C.taliensis。C.taliensis和C.oleifera基因在叶绿体基因组上的位置比较保守。在C.taliensis和C.oleifera中共发现71个indels,71个indels多发生在基因间区,占95%,大小从1 bp到90 bp不等,总长度为495 bp。在C.oleifera的叶绿体基因组上发现2个大的缺失,长度分别为90 bp和65 bp;(2)对82个物种的78个蛋白质编码基因进行系统发育分析发现,大多数的节点(64/76)有≥95%的支持率,其中58个节点的支持率达到100%。在系统发育树上的主要分支,如被子植物的基部类群,单子叶植物和真双子叶植物都有很高的支持率;(3)C.sinensis var.assamica的叶绿体基因组上共有31个位点发生了RNA编辑,其中26个编辑位点位于编码区,导致了氨基酸序列的改变。在C.sinensis var.assamica包含1到2个内含子的11个蛋白质编码基因中,有9个检测到内含子剪切现象。