论文部分内容阅读
Pre-mRNA的可变剪接是真核生物基因表达的重要调控机制,也是产生蛋白质组多样性的主要原因。可变剪接的发生受顺式序列元件、反式蛋白因子以及组蛋白修饰等多种因素的调控。可变剪接在真核生物的组织分化、发育、疾病发生等生命过程中发挥着重要作用。近年来,可变剪接已成为生命领域的重要研究方向之一。伴随着RNA-Seq等新一代高通量测序技术的快速发展,大量多外显子基因的可变剪接现象被发现。人类基因组中~95%的多外显子基因会发生可变剪接;拟南芥、水稻、玉米等植物基因组中,~60%的多外显子基因存在可变剪接。目前,已有诸多针对人类、小鼠等动物基因组的可变剪接研究工作,但植物基因组的可变剪接工作相对较少。植物转录组研究显示植物pre-mRNA可变剪接的发生与组织分化、器官发育、环境胁迫等生物学过程密切相关。本工作基于公共数据库(GEO)中拟南芥不同组织和环境胁迫的RNA-seq测序数据,使用生物信息学方法系统地分析了拟南芥的种子、根、叶、花、花梗、节间、长角果等组织中以及种子不同萌发阶段的基因表达和可变剪接特征;另外,探索了冷胁迫对拟南芥基因表达和可变剪接的影响。具体研究内容总结如下:(1)拟南芥不同组织的基因表达和可变剪接分析。基于RNA-seq测序数据,使用转录组数据分析常用的Trimmomatic、Salmon、DESeq2、SUPPA2等工具,建立了拟南芥的种子、根、叶、花、花梗、节间、长角果共7种组织的表达基因和可变剪接事件图谱;识别了7种组织间的差异表达基因和差异可变剪接事件,并分析了相关基因的生物学功能。结果显示可以通过差异可变剪接的方式,介导基因组对拟南芥花器官发育的调控,进而证实了可变剪接在植物组织和器官发育以及分化过程中的重要性。(2)拟南芥种子萌发过程中的基因表达和可变剪接分析。首先,通过结合使用Hisat2、StringTie、DESeq2等工具得到拟南芥干种子、萌发1-3天的种子、未成熟的种子和成熟的种子共六个种子发育阶段的基因表达矩阵,对种子不同萌发阶段间的差异表达基因进行了鉴定,并解析了其生物学功能。结果显示:随着种子的萌发,与糖酵解、DNA合成等代谢过程密切相关的基因被激活,保证了种子新陈代谢和基本的细胞活性的重新激活;与氧化应激胁迫响应、有毒物质响应、热响应、水响应等相关的基因活性被抑制,保证了种子能够从休眠态顺利活化。其次,使用rMATS工具系统描绘了种子萌发过程中各阶段的pre-mRNA可变剪接图谱,鉴定了不同萌发阶段间的差异可变剪接事件,并分析了种子萌发过程中的可变剪接特征及差异可变剪接事件的生物学功能。(3)冷胁迫下拟南芥叶组织的基因表达和可变剪接的分析。以拟南芥叶组织在4℃的环境下冷胁迫0小时、1小时、3小时、6小时、12小时、24小时的RNA-seq测序数据为研究对象;运用Trimmomatic、Salmon、DESeq2、SUPPA2等工具,识别了各个胁迫条件下的表达基因和可变剪接事件,而且对不同胁迫条件间的差异表达基因和差异可变剪接事件进行鉴定;对差异表达基因和差异剪接事件的生物学功能进行了分析,识别了拟南芥基因组的响应冷胁迫的基因。本工作的开展将有助于进一步阐明植物基因组中不同组织、种子不同萌发阶段的基因表达和可变剪接调控机制;也将促进对环境胁迫下基因表达和可变剪接调控机制的理解。