论文部分内容阅读
生命科学是21世纪最有潜力的学科之一。其研究目的是理解人类疾病的致病机理并造福全人类。选择性剪接是位于转录和翻译之间的过程,它使得一个基因能够编码多个蛋白质,从而大大的增加了基因表达蛋白质的多样性。在小鼠中发生选择性剪接的基因所占的比率大约为75%,而在人类中超过95%的基因具有选择性剪接的特性,选择性剪接的调控机制复杂,依赖于顺式作用因子和反式作用因子之间的相互作用,两者的异常都有可能导致疾病的发生。RNA结合蛋白质通过结合在pre-mRNA上来调控选择性剪接事件,它的异常能够导致很多严重的疾病。最近的研究表明RBP(RNA结合蛋白质)的调控功能呈现出位置特异性,即结合在不同的区域可能会有相反的功能。本文第二章结合了eCLIP-seq和RNA-seq两种数据,对47种RBP的位置特异性进行了分析。结果表明,绝大多数的RBP结合在外显子上时,会促进外显子被保留,而结合在内含子上时,则会抑制外显子被保留。另外本研究发现,虽然人类中有多达数百个RBP,但并不是所有的RBP都会直接的参与到选择性剪接的调控中,本研究所考虑的47个RBP能够在一定程度上对选择性剪接事件的结果进行预测。随着新一代测序技术的到来,一次RNA-seq实验能够得到数以万计的选择性剪接事件集,然而它们中的大多数是中性的(即它们的异常并不会导致疾病),因此急需一种能够对选择性剪接事件的重要程度进行分析和排序的工具。本文第三章从HGMD中选择能够导致疾病的、功能性重要的外显子,从千人基因组计划中选择不导致疾病的、功能性非重要的外显子,并对两组外显子在蛋白质等特征上的差异进行分析。最后,本研究利用机器学习算法将得到的模型封装为网络服务器ExonImpact从而方便其它科研工作者的使用。同义突变并不直接影响蛋白质的结构和功能,它们通过改变外显子和临近内含子的顺式作用位点来影响剪接的调控,从而导致蛋白质表达的改变。最近的研究表明,超过90%的导致人类疾病的突变位于蛋白质编码区间以外。本文第四章使用机器学习的方法试图预测出更有可能导致疾病的同义突变,并创新性的引入了蛋白质的相关特征。研究发现,易致病的同义突变所在的外显子和不易导致疾病的同义突变所在的外显子在很多特征上都会表现出很大的不同。本研究利用这些特征在两个组群之间的区别,构建了以机器学习为基础突变功能预测器regSNPs来研究同义突变对疾病产生的影响,并进行预测和评估。最后本研究把regSNPs封装为网络服务器从而方便其它科研工作者的使用。脂多糖是一种革兰氏阴性细菌的表面抗原,它能够引发细胞内一系列的应激反应,之前的研究表明脂多糖能够提升BMSC细胞(骨髓间充质干细胞)对缺血和组织损坏的修复。本文第五章系统性的分析了脂多糖诱导的BMSC细胞系中选择性剪接事件的改变,对这些差异表达的选择性剪接事件的分析表明,其中富集了大量的转录后修饰位点并且包含了很多关键的蛋白质作用域。本研究的发现丰富了目前关于脂多糖对BMSC的作用与功能的研究。