论文部分内容阅读
在真核生物中,基因表达主要包括转录、剪接和翻译三个过程。基因剪接是基因表达过程中的核心步骤。基因选择性剪接是指一个基因可以编码多个蛋白质。基因选择性现象在真核生物中普遍存在。基因剪接是个高度调控的过程,多种调控信号参与其中,主要包括:剪接位点,剪接调控元件和分支位点。根据剪接调控元件的剪接功能和所处的位置,剪接调控元件可以分为四类:外显子剪接增强子,外显子剪接抑制子,内含子剪接增强子和内含子剪接抑制子。这些信号共同合作调控产生成熟RNA、编码蛋白。通过分析和建模这些调控信号,对全面认识调控信号的功能、理解基因选择性剪接过程具有重要意义。大量研究表明,异常基因选择性剪接是一种重要的致病机制。基因组突变改变基因剪接调控信号,诱发异常基因选择性剪接,是导致疾病发生的重要原因。为了深入了解基因选择性剪接调控机制和在剪接层面理解突变的致病机制,本文通过应用序列模式挖掘建模分析了剪接调控元件和剪接位点序列,并进一步量化研究了基因组突变对这两类信号的影响。本文主要研究工作和创新之处如下:(1)全面分析了剪接调控元件的功能属性,及其基因变异对剪接调控影响。首先根据剪接调控元件的序列特性,选择并验证了序列模式挖掘方法对调控元件剪接功能的量化识别能力,随后利用该方法预测发现了潜在的新的剪接调控元件;然后通过定量分值计算发现,不同剪接元件展示出相似的功能;紧接着统计剪接调控元件的位置频率,发现了多重调控元件频率特性;最后分析了外显子突变和单核苷酸多态性的剪接影响。由实验结果得出:a.诱发外显子跳跃事件的突变具有更大的概率破坏了外显子增强子、并产生外显子抑制子;b.相较于模拟突变,单核苷酸多态性破坏外显子增强子和抑制子的概率降低。(2)应用序列模式挖掘方法,研究癌症体细胞剪接位点区域突变对剪接的影响。首先,提取了所有落在剪接位点区域的癌症体细胞单核苷酸突变。然后对比单核苷酸多态性,随机突变和癌症体细胞剪接位点区域突变三种突变的剪接分值的改变情况,结果显示癌症突变明显弱化了剪接位点信号强度;最后使用TCGARNA-seq数据验证序列模式挖掘方法的预测效果,其中ZNF7的RNA-Seq数据结果和我们的方法预测结果保持一致。这个研究为探索癌症致病突变提供了一种方法与途径。