论文部分内容阅读
结构域是蛋白质的一个结构层次,可以看作蛋白质结构,折叠,功能,进化和设计的基本单位。大多数的蛋白质都可分为若干个结构域,结构域的不同组合使蛋白质具有不同的三级结构并具有不同的功能。蛋白质结构域的划分在理论与应用上都具有重要意义,但目前对结构域的划分还没有一个十分理想的方法。划分结构域的核心问题是用什么标准去划定结构域的界限,而这些标准是否具备足够的合理性。基于蛋白质结构域是折叠单位的设想,蛋白质结构域的折叠与去折叠形式具有不同热力学能量状态,蛋白质结构域的折叠是由自由能变化驱动的。一般认为,天然蛋白质构象处于热力学上一个低能量态。如果认为结构域作为一种独立折叠单位,则应该不但结构上相对紧密,而且热力学能量上也必然是处于较低能量状态。折叠的单位要求伸展的蛋白质折叠成一个能量较低状态,这一点是没有问题的。而自由能和结构域作为结构、功能、进化和设计的基本单位的关系也可以在结构域具有相对稳定性和能够独立存在这一方面的要求统一起来;至于作为一个设计的基本单位,初看起来它并不是结构域本身的特性,而是一个实际应用的问题,但是,从结构域能够独立存在这一点来看,它也必然与结构域本身的特性有密切的关系。为此,我们提出了一个采用折叠自由能划分蛋白质结构域的方法,概括了结构域定义的最基本的特点。对于双结构域蛋白质,首先把一个蛋白质在序列上不同的切点划分成连续的两部分,然后用结构参数化方法分别计算蛋白质两部分的自由能,综合比较不同划分情况下蛋白质两部分的自由能, 确定该蛋白质的最佳结构域划分位点。我们一共选取 50 个不同种蛋白质的结构域划分结果作为计算的对照集,其中 49 个来自于其他结构域划分程序的结果,1 个来自于实验报道。大多数蛋白质的结构域划分结果与文献报道一致,另外一些虽然与文献报道结果不一<WP=3>ii 中文摘要致,但比文献报道结果可能更合理。说明以折叠自由能为基础划分蛋白质结构域的想法是合理和可行的。 将折叠自由能应用于连续结构域的划分得到了比较满意的结果,为了使这一方法能够应用于任意数目的、连续或不连续结构域的蛋白质系统,我们对该方法进行了全面改进,使之成为一个称之为 PDOM 的完整的结构域划分系统。基本思想是:首先构建一个氨基酸残基相互作用矩阵,然后根据残基相互作用的大小对残基重新排序,并得到一个经过重新排序,反映残基相互作用关系的残基序列;然后用以前报道的方法沿着重排序列在不同切点将蛋白质结构划分为两部分结构,比较不同切点的去折叠自由能并考虑其他影响因素确定一个最佳切点,得到两部分结构,用相同的标准,对每一部分结构,尝试进一步的划分,直到无法继续切分为止。用由 55 个蛋白质结构组成的测试数据集评估 PDOM,如果以晶体结构作者确定的结构域划分作为标准,PDOM 的划分准确率为 76%。