论文部分内容阅读
选择性剪接是真核生物在后转录过程中最为重要的调控机制之一。经过二十多年的研究,尽管生物学家们已经初步了解了选择性剪接的模式、过程以及某些调控因子的功能,但是还远没有掌握选择性剪接的真实调控机理。近年来,随着科学家们对某些疾病(尤其是癌症)研究的深入,选择性剪接作为导致疾病的重要来源之一越来越得到重视。目前,在高通量芯片技术和高通量测序技术的推动下,全基因组范围内研究选择性剪接的调控机制正在成为生物界最为前沿、最为热门的话题之一。然而,目前该领域的研究基本上还处于生物实验阶段,本文最大的创新之处在于受选择性剪接的分子生物学过程的启发,首次通过模型来对选择性剪接调控因子及其功能进行预测。
本文首先对选择性剪接的分子生物学过程,最新的研究技术和调控因子预测方法进行了较为详细的综述。
其次详细设计了基于外显子芯片数据的统计方法和数据处理流程,目标是找出具有统计意义的发生选择性剪接差异的外显子,这些外显子的表达量差异和周围区域的候选模体信息将作为下一步模型的输入。
在上述分子生物机理研究和外显子芯片数据分析的基础上,建立了一种线性的选择性剪接模型,该模型将两种状态下选择性剪接的差异考虑为多个调控因子的综合作用,通过外显子包含贡献值来评价每个候选模体对剪接差异的贡献。在搜索调控因子结合模体的环节,如果通过递归最小二乘算法,计算时间无法接受,因此本文引入了蚁群算法,采用并行计算。这种智能的启发式搜索算法大大提高了搜索效率。此外,本文还分析了各种参数设置对模型搜索结果的影响。
线性模型能快速有效地从大量的待选模体中提取出最为重要的调控因子,这对于从海量的生物数据中提取最为主要的信息来说,是很有意义的。为了进一步研究提取的调控因子的具体调控功能,基于线性模型预测的结果,本文设计了基于模糊理论和支持向量机的功能预报模型。该模型经样本训练,能从以下三个方面对选择性剪接调控因子的功能进行预测、分析与评价:
(1)预测单个调控因子对剪接差异的调控功能;
(2)评价某一调控因子的功能受其他调控因子的影响;
(3)预测多个调控因子的综合调控功能。
由于选择性剪接机制十分复杂,本文最后简要提出了下一步的研究方向,并讨论了进一步完善模型的思路和方法。