白桦全基因组测序及分析

来源 :东北林业大学 | 被引量 : 5次 | 上传用户:1igang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
白桦(Betula platyphylla)是桦木科(Betulaceae)桦木属(Betula)的落叶阔叶树种,主要生长在亚洲温带和寒温带地区,最典型的特征是纸张状剥离的灰白色树皮和长长的横纹样皮孔。白桦是我国北方重要的绿化和用材树种,同时还具有很高的药用价值,一直被科研人员所关注。然而,白桦目前还缺乏完整的基因组信息,这严重制约了相关研究的进展。因此,本研究将利用二代和三代测序技术,对白桦基因组进行调研,分别对其细胞器和细胞核基因组进行组装和注释,并分析其特征,最终得到较为完整的白桦全基因组信息,为白桦分子及育种研究奠定基础;同时基于东北林业大学高性能计算机集群,开发一套适合于高杂合林木基因组的拼接注释流程,为今后其他林木基因组的解析提供帮助。基因组调研显示,白桦基因组大小约为432.9 Mb,杂合率约为1.22%,重复序列含量约为47.9%,属于高杂合基因组。同时发现野外取材的白桦叶片含有细菌污染,可能会对测序结果产生影响。因此最终决定采用无菌的白桦组培苗作为试材,通过二代和三代测序技术完成白桦全基因组测序。叶绿体基因组分析表明,白桦叶绿体基因组全长160,518 bp,包含一对长26,056 bp的反向重复序列(IRs)和被它们隔开的 89,397bp的长单拷贝(LSC)和 19,009 bp的短单拷贝(SSC)片段。整个叶绿体基因组共注释得到129个基因,包含84个编码蛋白的基因,37个tRNA基因和8个rRNA基因。在编码蛋白的基因中,有3个使用了非ATG起始密码子。比较基因组学显示,壳斗目物种叶绿体基因组相对保守,但也存在一些变异热点区域,可以用于设计分子标记。RNA编辑位点识别表明,白桦叶绿体中至少有80处RNA编辑事件发生,其中大多数为C到U的转变,而少部分不是。特别是3个rRNA上的位点可以被编辑成2个以上不同的碱基,这在以往的研究中从未被报道过。对那些不改变氨基酸的同义编辑,其相对同义密码子使用度(RSCU)均有所提高。系统演化分析表明,与矮小桦(B.nana)相比,白桦和银桦(B.pendula)有着更近的亲缘关系。线粒体基因组分析则显示,白桦线粒体基因组全长581,539 bp,GC含量为45.5%。其上共注释得到了 65个基因,其中编码蛋白的基因40个,tRNA基因22个,rRNA基因3个。重复序列分析表明,白桦线粒体基因组上有96个长散在重复序列,其中包括43个正向(forward)和53个回文(palindromic)重复序列。基因组比较的结果显示,白桦线粒体基因组与近缘种银桦线粒体基因组具有良好的共线性。白桦线粒体中共识别出475处RNA编辑位点,远多于叶绿体。共线性分析显示,白桦线粒体基因组中有5个长片段区块来自叶绿体,占总长度的4.2%。白桦核基因组分析表明,共装配出contigs 1,540条,总计 430.4 Mb,contig N50为754.6 kb,GC含量为35.7%。利用子代和双亲的遗传图谱信息,将91.3%的contigs挂载到14条假染色体上。重复序列分析表明,白桦核基因组中的重复序列占50.54%,其中以转座子为主。非编码RNA注释共得到tRNA基因512个,rRNA基因265个。功能基因结构注释显示,在白桦核基因组上,共注释到编码蛋白的基因31,578个,基因区平均长度为4,229 bp,CDS平均长度为1,089 bp,每个基因平均含有4.78个外显子,鉴定出存在可变剪切现象的基因7,086个。BUSCO检测结果显示,94.2%的基因在白桦注释结果中被完整覆盖。基因功能注释结果表明,有27,965个基因得到了注释,占总数的88.6%。共线性分析显示,白桦与葡萄(Vitis vinifera)和毛果杨(Populus trichocarpa)基因组在染色体水平上有良好的共线性,且白桦和葡萄的一些典型共线性区域在毛果杨染色体上存在2个对应区域。全基因组复制分析进一步显示,白桦与葡萄一样,在被子植物形成后,仅经历了 1次全基因组三倍化事件。系统演化分析则表明,白桦与银桦亲缘关系很近,两者大约于2.6 Mya分开。
其他文献
目的:影响子宫内膜癌预后的高危因素很多,有病理类型、组织学分级、肌层浸润深度、宫颈浸润、淋巴结转移、淋巴脉管间隙浸润、附件转移等,但大部分高危因素在术前不易准确测知,期
近年来,护城河的保护与开发日益受到关注。本文在实地调研的基础上,分别采用TCM法、CVM法及生态学方法,从旅游游憩价值、历史文化价值和生态价值角度对内秦淮河滨水区的经济
交互艺术设计让观众置身作品其间,可以对作品形态进行改变,从而使作品的呈现方式发生变化,这些变化并不能完全被设计师掌控,而是来自于由受众协力控制的演变发展、不断变化的
随着社会主义市场经济和卫生经济体制改革的不断深化,加强医院固定资产管理尤为重要。依托新《医院财务制度》的实施,提高医院领导层对固定资产管理的意识,建立“三账一卡”
祈使句是表示“命令”、“请求”、“建议”、“号召”、“劝告”、“叮嘱”等意义的句子。它的结构模式如下:一、用动词原形主语为第二人称的祈使句,直接用动词原形开头,其
<正> 西方现代建筑史中,许多里程碑式的事件发生在美术馆,这绝不是偶然的事。伦敦泰特美术馆里的“建筑中的解构”(deconstruction in architecture)和纽约现代艺术博物馆里
讨论了程序设计课程教学的特点,研究了利用多媒体计算机进行课堂教学的技术优势和教学方法,对如何发挥多媒体教学优势、提高教学质量、培养学生的程序设计能力进行了探索和实
目的 了解甘肃地区SLCO1B1和ApoE基因的分布特征及基因型对血脂水平的影响。方法 采用横断面研究,对甘肃省人民医院心内科的386名患者采用聚合酶链反应进行基因多态性分析并
目的研究针对某民用航空机载电子设备的HALT方案与实施,以此提高该设备的固有可靠性。方法基于环境应力和失效的统计分布关系,结合某民用航空机载电子设备的特点,设计针对性
目的:通过回顾性对比腹腔镜辅助远端胃癌D2根治术与开腹远端胃癌D2根治术所获得的相关数据,研究并探讨腹腔镜辅助远端胃癌D2根治术的彻底性、可行性及近期疗效情况。方法:回顾性