论文部分内容阅读
结构域是蛋白质的结构和功能区域,在蛋白质相互作用过程中发挥重要作用。近年来,已出现多种从结构域水平预测蛋白质间相互作用的方法,这些方法大多基于结构域对之间发生相互作用的频率特征建立预测模型。其不足在于,由于训练样本有限,只能获取部分结构域对的出现频率,从而无法完全预测待预测蛋白质对的相互作用关系。
为了解决这个问题,本研究基于蛋白质间相互作用由多个结构域联合作用导致的假设,提出了一种预测蛋白质相互作用的新方法。该方法基于结构域组合对序列的氨基酸理化性质建立序列特征向量,并使用支持向量机对结构域组合对间相互作用关系进行分类预测,得到其序列特征值,同时采用统计分析的方法获取其频率特征值,最后融合上述两种特征估计结构域组合间发生相互作用的可能性,并以此预测蛋白质间相互作用关系。
经过实验测试,该方法对于酵母蛋白质相互作用关系的预测敏感度与预测专一性分别达到70%和62.8%。此外,对于所含结构域组合对具有显著统计特征的蛋白质对,该方法的预测敏感度与专一性分别达到96.77%和78%,略优于Han等提出的PreSPI方法。测试结果显示该方法能够预测所有结构域组合间相互作用关系,对于蛋白质相互作用关系有着较好的预测效果。
基于上述方法,本研究开发了蛋白质相互作用预测软件PPIPred,并提供网上服务(http://iNFosci.hust.edu.cn.)。