论文部分内容阅读
大部分蛋白质需要通过与其他蛋白质或分子的相互作用来完成其生命功能,对蛋白质-蛋白质相互作用的研究需要蛋白质复合体的三维结构。与测量蛋白质单体结构相比,实验上测定复合体三维结构相对比较困难。因此,目前实验测定的蛋白质单体的结构数量已经远远大于复合体的结构数量。通过蛋白质-蛋白质对接方法可以帮助预测蛋白质复合体的三维结构。在很多蛋白质-蛋白质对接方法中,几何匹配是最为重要的打分方式,因此如果能够改进目前的几何匹配模型,将会对很多对接方法都有所帮助。正确的生物学信息可以帮助预测复合体三维结构,错误的生物学信息会导致预测失败,所以不可靠的生物学信息难以被直接利用。许多蛋白质分子对接方法都是基于快速傅里叶变换(Fast Fourier Transform, FFT)算法。基于FFT方法的对接算法都以几何匹配打分为主要的打分依据。我们在传统的FFT对接方法的基础上,开发了基于原子溶剂化参数(Atomic Solvation Parameters, ASP)模型的新的对接方法——ASPDock。ASPDock用ASP打分替代了FFT方法中原有的几何匹配打分。FFT方法中的ASP打分在计算方法上与纯几何匹配有一些相似,但比几何匹配有着更加明确的物理意义。纯几何匹配只是反映了蛋白质复合体的几何性质,而ASP模型能够成功地计算蛋白质-蛋白质复合物的结合自由能。我们使用ASPDock计算了21组实验已经测定了结合能的复合体。当格点大小取值为1 ?时,得到的21组复合物的ASP打分与实验测定的结合能之间的相关性(r≈0.69)要高于几何匹配与实验结果的相关性(r≈0.48)。这个结果表明,ASPDock的打分方式要比几何匹配的打分方式更为可靠。在针对Benchmark3.0的124组复合体的测试中,ASPDock的预测成功率也明显优于几何匹配。在蛋白质对接的算法中,利用可靠的生物学信息可以有效地提高预测的成功率。因此很多小组开发了各种不同的理论方法来预测蛋白质的相互作用位点信息。然而,目前各个小组的理论预测方法并不是完全可靠的。为了能够利用能够这些不完全可靠的理论预测方法来帮助对接算法,我们开发了一个软限制(softly restricting method,SRM)的方法来利用这些信息。SRM方法在ASPDock的基础上,通过提高某些关键残基的权重的方式来使采样倾向于在集中那些关键残基附近。SRM方法对正确的信息非常敏感,而对错误的信息不太敏感,这样可以有效地降低使用不可靠信息的风险性。我们在99组蛋白质复合物上进行了测试,结果表明,即使利用有风险的理论预测位点信息,SRM方法依然可以提高预测的成功率和增加预测到的近天然态结构的数目。ASPDock和SRM方法也在CAPRI(Critical Assessments of PRediction of Interactions)的第18轮和第19轮比赛中取得了成功。通过ASPDock和SRM方法的结合使用,我们预测得到了CAPRI T40和T41的高精度结构,LRMSD分别为2.35 ?和1.41 ?.