论文部分内容阅读
蛋白质是由氨基酸组成的链状生物大分子,直接参与生物结构的形成,在控制和调节生物功能的过程中起着重要的作用。蛋白质折叠问题是分子生物学中心法则中联系生物遗传信息与功能的关键环节,这一问题的解决,将会极大的推动人们对生物大分子结构与功能的认识。蛋白质折叠问题包含两个方面的内容:正折叠问题(称为蛋白质折叠)和逆折叠问题(即蛋白质设计)。蛋白质折叠问题研究的是氨基酸一级序列如何决定其三级结构,目的是从序列出发预测蛋白质构象。与蛋白质折叠问题相反,蛋白质设计问题主要研究在特定的温度下,给定一个蛋白质的天然结构,设计出能折叠成此结构的氨基酸序列。
蛋白质折叠和蛋白质设计的研究是当代分子生物学的热点问题,具有重要的科学意义。本课题组提出了基于相对熵的蛋白质从头折叠方法,该方法是基于物理学原理,用“相对熵"代替体系的哈密顿作为优化函数,是对能量优化的改进,更接近于从自由能的角度考虑体系的优化。这一方法从理论上可以作为研究蛋白质折叠与蛋白质设计的统一框架,已经成功地应用于真实蛋白质折叠与设计的研究中,并取得了较好的结果。对蛋白质折叠(设计)问题,该方法的实质是在按照Blotzmann分布的构象(序列)空间搜索一条使给定序列(结构)具有最大占有率的结构(序列)。
复杂网络研究的兴起,为蛋白质折叠以及结构.功能关系的研究提供了全新的角度与思路。蛋白质分子可以视作以氨基酸为节点,以残基间相互作用为边连接而构成的复杂系统。通过对蛋白质氨基酸网络拓扑特征量的分析,可以提取有关蛋白质折叠的一些普遍信息,进而揭示蛋白质拓扑结构对折叠的决定性作用。
本论文的工作主要包括三部分:第一部分,是基于相对熵及HNP(疏水、中性、亲水)模型的蛋白质设计方法在不同蛋白质体系中的应用;第二部分,是基于相对熵的蛋白质折叠方法的改进;第三部分,是基于残基距离涨落的氨基酸加权网络模型的分析。
(1)详细考察了基于相对熵及HNP模型的蛋白质设计方法对于不同结构类型蛋白质的适用性,分析了该方法对20种残基的预测成功率以及不同二级结构中各残基的预测成功率,并与基于HP模型方法的预测结果做了比较。通过对190个四种不同结构类型的蛋白质进行预测,结果表明基于HNP模型及相对熵的设计方法对于不同结构类型的蛋白质具有普适性。另外,分析了不同残基预测结果中三种残基类型出现几率的差异性。最后还讨论了该方法对保守性残基和非保守性残基的预测情况。这些研究为基于相对熵的蛋白质设计方法的应用和进一步的发展打下了良好的基础。
(2)从两个方面对基于相对熵的蛋白质结构预测方法进行了改进。一方面,在以前的研究工作中,接触势系综平均值的计算采用了一个估计值,为了使该物理量的计算更加精确,本论文基于热力学微扰理论,提出了一种新的接触势系综平均值的计算方法。另一方面,由MJ矩阵代替了以前工作中采用的MJ矩阵的简化形式,来表示20种残基之间的接触势。用改进后的方法对12个蛋白质进行了测试,预测结构相对于天然结构的均方根偏差(RMSD)在0.4~0.6nm之间。与接触势系综平均值采用估计值的方法相比,平均预测精度提高了0.044nm。
(3)提出了一种以残基间距离涨落为权重的氨基酸加权网络的构建方式。采用高斯网络模型(GNM)计算蛋白质在平衡态下残基之间距离的涨落大小,认为残基间距离涨落越小,它们之间的连接就越紧密,连接边的权重就越大。对180个非同源蛋白质的非加权与加权氨基酸网络进行了统计分析,并与同等规模的随机网络进行了对比,比较了权重对网络参量的影响。考察了加权和非加权氨基酸网络的“小世界”特征及层次模块性。并且利用网络参量介数就加权网与非加权网对折叠核的区分能力进行了比较,证实了加权网较非加权网包含了更多的蛋白质结构信息。