论文部分内容阅读
背景和目的:RNA剪接是真核生物基因转录后加工的关键步骤,剪接体通过识别剪接信号切除内含子形成成熟的mRNA。剪接信号除了 5’剪接位点、3’剪接位点及分支点序列外,还存在辅助性的剪接调控元件(splicing regulatory elements,SREs)等剪接信号。研究表明人类95%以上的基因在剪接过程中会通过识别不同的剪接信号发生可变剪接,得到多个转录本,因此剪接信号在RNA可变剪接调控中具有重要的作用。RNA结合蛋白通常特异性的识别3-7个碱基序列,这为系统性研究SREs提供了可能性,但至今还没有这方面工作的报道。我们以脊髓性肌萎缩症相关基因SMN2为模型,构建一个连续5碱基RNA序列库,系统研究1024个不同的5碱基RNA序列对SMN2外显子7剪接调控的影响,分析发现新的SREs,并寻找与SREs相互作用的RNA结合蛋白,探索在RNA可变剪接过程中SREs发挥作用的机制。本课题不仅为研究RNA可变剪接提供新的分子机制而且可以为设计RNA为靶点的基因治疗药物提供理论依据。方法:以脊髓性肌萎缩症(spinal muscular atrophy,SMA)相关基因SMN2为研究模型,采用两步突变法在SMN2 minigene内含子7的核苷酸第11位到15位区域进行5碱基全序列突变,构建完整45个序列组合(即1024个)的5碱基序列库。接着将1024个质粒转染HEK293细胞检测5碱基序列库中各序列对SMN2剪接的影响,利用荧光RT-PCR测定外显子7的列入百分比。之后采用生物信息学基因集富集分析法鉴定出最强的20个抑制性和促进性的3-4碱基的剪接调控元件,同时根据5碱基序列对剪接调控的影响并结合其两侧序列确定出多个新的强剪接调控元件。最后在SMN2和其它基因背景下对新发现的剪接调控元件作初步特征分析。结果:首先构建了国际上第一个系统性研究RNA可变剪接调控的完整的5碱基序列库。其次在HEK293细胞里,分析了 1024个序列对SMN2外显子7列入的调控作用,获得大量调控可变剪接的序列信息,包含多个尚未报道过的SREs,其中部分SREs的调控作用依赖5碱基两侧的序列。我们对其中两个强SREs(GCACC和GCAAACCTT)进行了初步特征分析,它们不仅能在不同位置强烈抑制SMN2外显子7的列入,也能改变MAPT、PDCD1基因的剪接模式,表明是具有共性的SREs。而且验证了 Poly-C和Poly-T的长度及其在不同位置对剪接调控的作用,但存在差异。同时,我们还证实了一个远距离RNA-RNA相互作用阻碍U1 RNA与5’剪接位点的结合从而抑制SMN2外显子7的列入,碱基配对数增加使其结构更加稳定,能增强抑制效果。最后,根据对数据库的分析,发现RBFOX1的核心结合序列UGCAUG如果后面连接C能够明显促进SMN2外显子7的列入,提示UGCAUGC可能是RBFOX1的最优结合序列。对各种SREs作用机制特别是其特异性结合蛋白的鉴定正在进行之中。我们的RNA剪接调控数据库包含有大量的剪接相关信息,可为后人研究可变剪接调控机制提供重要的信息资源。结论:建立了一个系统完整的RNA剪接调控序列库,分析了所有1024个5碱基序列组合对SMN2外显子7剪接的影响,发现了大量新的SREs。其中两个强抑制性序列GCACC和GCAAACCTT可以在多种基因调节RNA可变剪接,是具有普遍性的剪接调控元件,而促进性的剪接调控元件Poly-C和Poly-T在长度依赖性和位置效应方面具有明显差异。我们的数据库还对前人提出的剪接调控假说进行了验证并对部分已知SREs序列进行了优化。