论文部分内容阅读
蛋白质具有在不同构象状态(非功能状态和功能状态)之间相互转换的内在能力。这种构象转换对蛋白质生物功能的产生与完成起着重要作用,如蛋白酶的催化能力、动力蛋白中动力的产生、蛋白变构效应的信息传递、离子通道的选择性过滤等,因此正确理解这些功能性构象转换的工作机制对于认识和调控生物功能起着至关重要的作用。实验方法虽然能够提供蛋白质构象转换过程中的主要构象状态和一些宏观参数,但是它不能够提供足够的中间构象来理解转换过程的分子机制和生物功能,因此计算成为研究蛋白质构象转换的另外一种重要手段。 本文主要从三个相辅相成的方面对蛋白质构象转换进行计算研究,主要包括了构象采样、结构相似性和结构分析。构象采样是为了获得蛋白质在不同状态之间的构象转换过程,为揭示生物功能提供数据。蛋白质结构相似性度量用于观测采样轨迹,识别其中的状态变化以及判断功能性的构象转移是否发生。这种识别和标识过程不仅对于正确理解构象采样十分关键,也为下一步的结构分析提供了基础,起着承上启下的作用。合适的结构分析方法能够对标识过的采样结果进行分析,从而揭示蛋白质构象转换的分子机制及其生物功能。基于实验所揭示的生物现象,本文提出了一种研究蛋白质构象转换的计算框架,包括构象采样方法、结构相似性度量以及采样所得构象的统计分析。这个框架的一个特点是不需要先验地知道蛋白质构象转换的自由能面和亚状态等动力学信息,这里面涉及到的构象转换过程和亚状态识别过程均由构象采样和蛋白质结构相似性相互配合来完成。具体地讲,这个计算框架包括以下三个方面: 1.在构象采样上,本文提出了将单个长时间尺度的整体构象转换问题转化成独立的、多步骤的短时间尺度的构象转换问题,从而实现对于蛋白质构象转换的快速采样。最近的实验研究表明蛋白质功能性构象转换的时间尺度通常在毫秒到秒之间,远远超出了现有计算采样的能力。本文在基于蛋白质构象转换存在着空间和时间的层次化结构这个假设的基础上,将复杂的长时间尺度整体构象转换问题分解成独立的、多步骤的短时间尺度构象转换问题,然后借鉴分布式模拟和并行模拟思想,使用一组并行短时间尺度分子动力学模拟代替传统的单个长时间尺度分子动力学模拟,实现蛋白质在不同状态或亚状态之间的构象转换。这种采样策略不仅能够提高计算资源的利用率,还能够有机地配合蛋白质结构相似性度量,使得蛋白质快速逃离局部能量最小点,减少不必要的采样,从而达到加速采样的目的。需要强调的是,该问题的创新性只是在于复杂构象转换的任务分解,而非采样的整个过程。 2.在蛋白质结构相似性度量上,本文提出了简正模结构相似性,并把它有机地结合到构象采样和后续的结构分析。这种结构相似性度量在本文提出的计算体系中起着承上启下的作用,是这个框架的关键部分,也是本文重要的创新之处。对于并行模拟轨迹获得的每个蛋白质构象,本文均使用弹性网络模型独立地计算其低频率简正模,并将其投影到参考状态的对应简正模,从而定义蛋白质结构相似性,进行模拟轨迹状态的识别,决定下一步模拟所采用的起始构象状态,或者终止采样过程。同时,这种构象采样的识别和标识过程也为下一步的结构分析提供了基础。 3.在结构分析上,我们结合本文采样特点,将几种比较常用的构象统计方法有机地结合在本文计算框架,用于揭示蛋白质构象转换的分子机制和生物功能。基于简正模结构相似性,我们可以对采样所得构象进行状态分类,然后使用不同方法分析每类状态下的统计特性,如相关性分析、主成分分析、聚类分析、网络分析等。不同状态之间统计特性的相似性和差异性则能够揭示构象转换的分子机制。需要说明的是,这些结构分析方法不是本文提出的,我们只是将它们有机地结合在本文计算框架里,用于分析构象转换的分子机制和生物功能。 本文将这种计算框架应用到不同类型的蛋白质。首先,我们用这种方法研究了一种模板蛋白质:腺苷酸激酶。该蛋白质系统具有丰富的实验和计算数据,为验证本文方法的有效性和优越性、说明本文方法的生物意义提供了一个良好的模板。通过计算发现,本文方法所揭示的腺苷酸激酶构象转换机制不仅符合其生物功能,具有很强的生物意义,而且能够发现其它方法不能发现的机理。此外,与实验测得的构象转换时间尺度相比,我们的计算方法极大的减少了采样所需时间尺度,提高了采样效率。其次,我们用这种方法研究了一种当前大家所关心的、功能还不清晰的蛋白质:AMP活化蛋白激酶。该蛋白质具有自抑制功能,在生物体能量平衡中起着重要作用。但是由于该蛋白质结构和功能十分复杂,使得这个蛋白质系统的结构信息不完整、功能发生机制不清晰,从而使得对于它的动力学研究具有相当的难度。通过使用本文计算方法,我们成功地揭示了这种蛋白质自抑制功能发生的动力学机制。值得说明的是,本文的研究是AMP活化蛋白激酶自抑制功能动力学方面的第一次研究,具有重要的参考意义。最后,简正模结构相似性在本文计算框架中起着承上启下的重要作用,为了说明它背后所隐藏的原理,我们研究了低频率弹性简正模的特性。低频率弹性简正模是定义简正模结构相似性的基础,通过使用不同方法,我们说明低频率弹性简正模除了大家所熟知的鲁棒性外,它们对于构象变化也具有相当的敏感性,揭示了简正模结构相似性能够识别蛋白质构象转换过程中的功能性亚状态的原因,为进一步理解模型提供了基础。