论文部分内容阅读
选择性剪接在生物体内广泛存在,它作为基因产生蛋白多样性的方式,在免疫反应、细胞分化、性别决定、神经发育以及生物进化等一系列生物学进程中起着重要的作用。在细胞核内,基因首先被转录成前体mRNA,然后剪接产生成熟的mRNA,这个过程中常通过不同的剪接方式产生多个转录本。随着高通量测序技术和生物信息学的发展,众多模式生物全基因组水平基因选择性剪接事件的鉴定揭示了基因转录在时间和空间上的复杂性。家蚕作为鳞翅目模式昆虫的代表,为鳞翅目基因组学研究重要参考。近年来,家蚕的转录组测序已经产生了大量组织和发育时期的样本,但目前仍缺少对家蚕全基因组水平转录本的挖掘、注释、和表达模式分析。因此,本研究收集家蚕的转录组数据,结合生物信息学方法,重新构建家蚕全基因组范围的转录本;对重构转录本进行分类和注释;预测其中的新基因以及新lncRNA;在家蚕全基因组水平鉴定基因选择性剪接事件,统计选择性剪接事件类型和分布情况;分析选择性剪接事件的组织特异和时期特异性表达,以及选择性剪接事件表达模式的可视化。获得的主要研究结果如下:1.重新构建家蚕转录本为了重建家蚕的转录本,收集获得近年来所发表的家蚕RNA-seq数据,经过滤、筛选得到58个样本,来源于12个组织器官,它们包括脂肪体、脑、后部丝腺、卵巢和精巢等。其次,利用Hisat2将各样本比对到家蚕基因组,然后,参考注释的基因集,利用Stringtie对合格的样本进行组装转录本,得到各组织样本的重构转录本,数量在19000条到40000条之间。最后,利用Stringtie merge对各组织样本的转录本合并得到64372条的总转录本,其中预测基因为26450个,平均每个基因有2个转录本,表明基因发生选择性剪接产生多个转录本。另外,通过与已注释基因进行比较分类,并且比较它们之间转录本长度、外显子数目等特征,结果显示重构转录本多外显子数目为171573个,单外显子数目10505,在已注释转录本中,多外显子数目为79442个,单外显子数目为3387个,表明重构的转录本包括了新外显子或新基因,为全基因选择性剪接分析提供数据基础。2.重构转录本注释和分析为了分析转录本的组成,如新基因转录本、非编码RNA转录本等,对重构转录本进行注释。首先,将重构转录本与已注释的基因集进行比较分析,得到15719条已知转录本,37831条转录本来源于已注释的基因集,10822条为未知基因的转录本。其次,对未知转录本中可能存在的新基因进行预测,得到189个新基因,它包含246条转录本。然后,对未知转录本中新lncRNA进行预测分析,得到494条新的lncRNA。最后,将编码基因与新lncRNA在16个样本中表达的FPKM值进行WGCNA共表达分析,获到18个lncRNA与其相关的编码基因存在共表达相关性。预测得到新基因和新lncRNA,这为完善家蚕转录本以及非编码RNA的研究提供帮助。3.家蚕全基因组选择性剪接事件鉴定为了在全基因组水平鉴定基因选择性剪接事件,首先,利用gtftogenePred对重构转录本进行格式转换,获到外显子剪接位点信息。其次,利用Rnaseqlib进行选择性剪接事件鉴定,在全基因水平共获得18468个选择性剪接事件,包括5种剪接类型:外显子跳跃事件为5399个、可变3’端选择性剪接事件为4622个、可变5’端选择性剪接事件为4110个、外显子排斥事件为1237个、内含子保留事件为3100个。最后,对获得的选择性剪接事件分布到家蚕的各条染色体上进行分析,得到各事件在各染色体上的分布都在321~1193个之间。其中,12号染色体上的剪接事件主要由外显子排斥事件构成,该染色体上BMgn010363基因产生大量的外显子排斥事件。BMgn010363基因具有34个保守外显子和58个选择性剪接外显子,构成4个可变区和3个独立剪接外显子,产生46条异构体转录本。该基因与昆虫DSCAM基因同源,都具有通过选择性剪接产生大量异构体的特征。家蚕全基因水平选择性剪接的鉴定将为研究基因的异构体和功能提供数据支撑。4组织特异、时期特异选择性剪接事件分析及表达模式可视化在家蚕全基因水平的选择性剪接事件分析的基础上,进行选择性剪接基因的表达模式分析。表达量比较分析发现,选择性剪接基因的表达量明显高于非选择性剪接的基因。使用miso计算4个胚胎时期样本和幼虫6个组织样本进行时间和空间表达模式分析,获得选择性剪接基因表达的PSI值并进行聚类分析,使用Jensen-Shannon score算法计算各样本特异剪接事件的显著性,得到卵期各样本的特异剪接事件的都在437-637之间,其中24h样本最多,例如BMgn011842基因在0 h样本具有特异剪接表达。各组织器官特异剪接事件在0-819个之间,其中,精巢中最多,例如BMgn003856基因在精巢组织具有特异剪接表达。特异剪接事件的结果表明,在家蚕不同组织和不同发育阶段基因选择性剪接事件存在时空特异性,特异剪接的基因将产生不同的蛋白,为在不同组织和不同发育阶段的基因生物学功能研究提供参考。