利用第三代纳米孔长读段测序技术构建和注释蜜蜂球囊菌的全长转录组

来源 :中国农业科学 | 被引量 : 0次 | 上传用户:mad1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]利用第三代纳米孔(nanopore)长读段测序技术对蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)的纯化菌丝(Aam)和孢子(Aas)进行测序,构建和注释球囊菌的高质量全长转录组.[方法]通过Oxford Nanopore PromethION平台对Aam和Aas进行测序.利用Guppy软件对原始读段(raw reads)进行碱基识别(base calling),通过过滤短片段和低质量原始读段得到有效读段(clean reads).通过识别两端引物鉴定全长转录本序列.通过比对Nr、Swissprot、KOG、eggNOG、Pfam、GO和KEGG数据库获得全长转录本的注释信息.分别利用CPC、CNCI、CPAT、Pfam 4种方法对长链非编码RNA(long non-coding RNA,lncRNA)进行预测,取四者的交集作为高可信度的lncRNA.[结果]Aam和Aas的纳米孔测序分别测得6321704和6259727条原始读段,经质控得到5669436和6233159条有效读段,其中包含的全长有效读段分别为4497102(79.32%)和4963101(79.62%)条.共鉴定到9859和16795条非冗余全长转录本,N50分别为1482和1658 bp,平均长度分别为1187和1303 bp,最大长度分别为6472和6815 bp.Venn分析结果显示有6512条非冗余全长转录本为菌丝和孢子所共有,分别有3347和10283个非冗余全长转录本为二者特有.此外,在球囊菌菌丝和孢子中共鉴定到20142条全长转录本,其中分别有20809、11151、17723、12164、11340和9833条全长转录本可注释到Nr、KOG、eggNOG、Pfam、GO和KEGG数据库.注释全长转录本数量最多的物种是球囊菌、Polytolypa hystricis和荚膜组织胞浆菌(Histoplasma capsulatum).GO数据库注释结果显示,上述全长转录本可注释到45个功能条目,涉及细胞组件、细胞和细胞器等细胞组分相关条目;催化活性、结合和转运器活性等分子功能相关条目;以及细胞进程、代谢进程和单一组织进程等生物学进程相关条目.KEGG数据库注释结果显示,上述全长转录本还可注释到抗生素的生物合成、核糖体、氨基酸的生物合成、碳代谢和剪接体等49条通路.此外,鉴定到648条高可信度的lncRNA,包含480条基因间区lncRNA、119条反义链lncRNA和49条正义链lncRNA.[结论]构建和注释了球囊菌的首个高质量全长转录组,为探究球囊菌转录组的复杂性,完善参考基因组的序列和功能注释信息以及深入开展球囊菌可变剪接体的功能研究提供了关键依据.
其他文献
介绍了一款高压高功率GaN功率器件及其匹配电路.基于国内高压GaN高电子迁移率晶体管(HEMT)的研究基础,选取了GaN HEMT芯片,确定了器件的总栅宽.根据GaN HEMT芯片阻抗,器件内
会议
ZnO是一种带隙宽度约为3.0 eV的Ⅱ-Ⅵ族n型半导体材料,其具有优异的光学性能、压电性能和电化学性能,广泛应用于传感器、太阳电池和催化净化等领域.介绍了目前纳米ZnO的主要
2008年8月24日,著名作家、《谁是最可爱的人》的作者魏巍,因病在北京去世,走完了他88年的人生旅程。遵魏巍生前意愿,他的骨灰被安放在河北省易县革命烈士陵园,与狼牙山五壮士
1995年9月份全国疾病监测点35种法定传染病疫情动态简介1995年9月份全国疾病监测点35种法定传染病疫情动态简介... September 1995 National Disease Surveillance Point 35 kinds of lega
热退火技术是集成电路制造过程中用来改善材料性能的重要手段.系统分析了两种不同的退火条件(氨气氛围和氧气氛围)对TiN/HfO2/SiO2/Si结构中电荷分布的影响,给出了不同退火条