森林草莓可变剪切基因挖掘与基因组重注释研究

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:cyhacmacyh007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
栽培草莓(Fragaria xananassa)属于多年生草本植物,因果实营养丰富,色泽鲜艳,深受消费者青睐。草莓果实属于假果,鲜嫩多汁的果肉来自于花托,而覆盖在花托表面的瘦果才是植物学意义上的果实。与其它蔷薇科植物如苹果和桃不同,草莓是非呼吸跃变型果实。栽培草莓是八倍体(2n=8 ×=56),来自4个不同的二倍体祖先种,因此其基因组非常复杂。二倍体森林草莓Fragaria vesca(F.vesca)是栽培草莓的祖先种之一,在北半球分布最广。森林草莓基因组(~240Mb)相对较小、植株矮小、生命周期短、能够进行高效的遗传转化,是研究栽培草莓和非呼吸跃变型果实的模式材料。本研究利用二代Illumina和三代SMRT测序技术,系统挖掘了森林草莓中的可变剪切基因,分析了草莓花与果实发育过程中可变剪切的动态变化,并对两个版本的森林草莓基因组进行了重注释,显著提升了森林草莓基因组注释的准确度和完整度。主要结果如下:1.在可变剪切分析中,三代比二代测序技术具有显著的优越性本研究采用PacBio公司的单分子实时测序技术(SMRT)及Illumina二代测序技术对森林草莓果实(花托)的可变剪切进行了系统挖掘和比较。通过SMRT鉴定到33,236个全长转录本,覆盖草莓基因组v2.0.a1中的10,957个基因。我们发现虽然SMRT的测序深度比Illumina低,但SMRT可检测到57.67%的多外显子基因发生可变剪切,而Illumina只检测到33.48%的多外显子基因发生可变剪切,说明SMRT能更有效地鉴定可变剪切。2.森林草莓可变剪切图谱的建立和果实发育过程中可变剪切的变化为了挖掘草莓果实发育过程中的可变剪切,收集先前的74个转录组数据,包括果实早期五个发育阶段的不同部分,总数据量达到19亿个读段。通过分析发现共有66.43%的多外显子基因发生可变剪切,其中内含子保留(IR)占比最高,随后分别为可变受体(AA)、可变供体(AD)和外显子跳跃(ES)。此外,还发现有2,453个基因由于可变剪切导致结构域的获得或缺失。通过挖掘果实发育过程中可变剪切的变化,发现草莓受精后的果实与受精前相比,内含子保留(IR)显著降低,而可变受体(AA)显著增加。KEGG富集分析表明IR显著降低的基因中剪切体途径基因显著富集,GO富集分析表明这些基因中一些重要的代谢基因显著富集。此外,这些富集基因在果实发育第一阶段的表达水平较高,从第二时期开始即大幅度降低,表明IR这种剪切方式可能是授粉受精后果实起始的重要调控机制。3.森林草莓V2基因组重注释在转录组数据分析中,发现森林草莓基因组注释准确性差,而且只包含了蛋白编码基因的编码序列。为了提高森林草莓基因组的注释质量,优化了基因组注释流程,结合PacBio全长转录组和RNA-seq数据,使用MAKER2,AUGUSTUS和PASA等软件进行基因组注释,同时利用Apollo进行人工校正。我们首先对森林草莓V2基因组进行重注释,新注释被命名为v2.0.a2。在新版注释中,被调整或新增的基因有13,168个,7,370个基因具有可变剪切转录本,18,641个基因的5’和/或3’端具有UTR。BUSCO值由88.9%增加到95.7%。此外,增加了 1,938个lncRNA,171 个 miRNA 和 51,714 个小 RNA 簇。4.森林草莓V4基因组重注释2018年,森林草莓V4基因组面世,因采用PacBio SMRT测序数据进行组装,其组装质量大幅度提高,与V2相比增加了 24.96Mb序列,基因数目却减少了数千个。另外,旧版森林草莓基因组均采用geneXXXXX命名基因,而V4基因组采用新的基因命名方式FvH4_XgXXXXX。为了改善新版基因组注释质量,建立了新注释v4.0.a2。在新注释中,基因数量由28,588个增加到34,007个,BUSCO评估完整度高达98.1%;调整了 8,342个现有基因的基因模型,添加了 9,029个新基因,10,176个基因能够产生可变剪切本。利用前期发表的大量转录组数据,建立所有基因在46种不同组织中的表达谱,方便读者查询。此外,鉴定了 84个已知miRNA基因和63个草莓特有miRNA基因,并预测了它们的靶基因。综上所述,我们的研究表明SMRT测序在识别可变剪切方面有非常大的优势,同时为后期对不同剪切本的功能研究提供了丰富的资源。此外,可变剪切不同类型的转变可能有助于果实形成时基因表达的快速变化。新注释在基因预测的准确性和完整性方面得到了显著改善,有利于草莓中的基因功能研究以及蔷薇科其他园艺植物的比较基因组分析。
其他文献
经济运行表现为两种形式:一种是均衡运行,另一种是非均衡运行。一般来说,均衡是暂时的,而非均衡才是经济运行的常态。在经济理论和方法的研究上同样分为两种,即一般均衡理论
目的 探索食管内照射支架研制、临床使用的可行性、安全性及初步疗效。方法 选择合适的覆膜或裸食管支架 ,于支架外周按一定的规律固定上特制的可容纳放射粒子的鞘 ,根据患
髹漆与金工,均是中国最传统最有历史价值和现实价值的文化遗产,是中华民族文化的代表。金工在漆器上的应用已经比较成熟,并且有着完整的体系,但髹漆在金银器上的应用却十分少
对非寿险公司和精算学者来说,不确定性最高,评估最困难的就是IBNR(Incurred But Not Reported)准备金,即已发生未报告未决赔款准备金。由于IBNR准备金的案发时间和最终赔付有
随着我国市场经济体制和集体林权制度改革的不断深化,林农逐渐开始分散经营。这种经营方式极大的解放了农村的生产力。但是也极大的增加了林农分散经营的风险。尤其是林业作
实证研究发现,刑事抗诉案件具有常见罪名集中、实体性抗诉偏重、不利于被告人的抗诉突出、抗诉效果评价指标差异显著等特点。刑事抗诉权运行受到抗诉制度及考评因素的影响,主
<正> 我国于一九八四年三月十二日颁布了专利法,从一九八五年四月一日起正式执行。执行专利制度,必将调动大家搞发明创造的积极性,加速我国四个现代化的建设。只要该发明创造
2018年是深化医药卫生体制改革的重要一年,医药企业得到了国家政策的大力支持,在投资力度和企业规模上都得到了空前的发展,医药企业也逐渐引起了投资者的高度关注。无论是为了帮助投资者对医药企业作出合理的投资决策,还是企业自身管理和发展的需求,都需要对企业的价值进行合理地评估。同时,经济增加值(EVA)于二十世纪九十年代由美国Stern Stewart管理咨询公司提出,目前广泛应用于各行各业的企业价值评
为了使业务人员对称重式降水传感器有较全面的认识,介绍了 DSC1称重式降水传感器的工作原理、性能参数和维护维修方法,为今后台站应用称重式降水传感器奠定基础。