论文部分内容阅读
甘蔗是重要的糖料作物之一,约占世界上食糖总产量的八成。割手密SES208、Molokai6081和热带种LA Purple是重要的甘蔗育种材料,其基因组倍性高、染色体数目多、重复序列比例高,严重制约了甘蔗基因组学的研究。目前,割手密SES208的单倍体AP85-441基因组序列已经公布,Molokai6081和LA Purple基因组草图已经绘制完成。着丝粒在物理结构上表现为细胞分裂中期染色体的主缢痕,在功能上非常保守,介导细胞分裂时期染色体的准确分离。着丝粒DNA序列主要由卫星重复序列、反转录转座子和少量基因序列组成,其演化速度较快,通常缺乏保守结构。因此,着丝粒区域往往难以组装,严重阻碍了基因组的拼接工作。基于功能着丝粒区域含有组蛋白H3变体CenH3这一典型特征,我们开展了Molokai6081和LA Purple染色质免疫共沉淀实验,并对测序数据进行生物信息学分析。研究结果如下:(1)基于序列相似性聚类分析获得了Molokai6081和LA Purple全基因组的重复序列,重复序列基因组占比高达82.2%和82.8%,其中LTR类反转录转座子分别为42.08%和44.80%,高比例的重复序列严重阻碍了甘蔗基因组的组装。(2)基于重复序列富集分析得到了Molokai6081和LA Purple候选着丝粒特异序列,通过细胞学验证分别得到了五条着丝粒特异重复序列,并且这些序列具有较高相似性,在两个甘蔗种中比较保守。序列注释发现Molokai6081和LA Purple着丝粒重复序列由卫星重复和Ty3/Gypsy类反转录转座子组成,具有典型的着丝粒序列特征。(3)基于序列比对分析和细胞学实验结果,发现这五条序列在SES208、Molokai6081和LA Purple基因组中比较保守。进一步分析发现,有两条Ty3/Gypsy类反转录转座子属于玉米着丝粒反转录转座子(CRM)序列。这些结果表明CRM序列在三个甘蔗种中较为保守,推测这些序列形成于染色体加倍事件之前,并且在长期的演化进程中被较为完整的保留下来。(4)基于生物信息学分析,明确了SES208、Molokai6081和LA Purple基因组的着丝粒位置,并指出了部分染色体着丝粒区域的错误组装,为基因组的组装提供了参考。基于转录组数据分析,发现SES208、Molokai6081和LA Purple着丝粒区域均存在有转录活性的基因,并且这些基因都存在于H3区域。这些结果对不同甘蔗种着丝粒序列的组成、结构及演化研究提供了参考,为基因组着丝粒区域的组装提供了建议,推动了甘蔗基因组学的研究。