论文部分内容阅读
蛋白质是生物功能的主要体现者和执行者,正是它们之间的相互作用实现了生物体的功能。对蛋白质和蛋白质相互作用的研究,不但有助于蛋白质功能分析、生命活动机制的理解,而且对于疾病诊断和药物设计有重要的现实意义。然而传统的鉴定蛋白质相互作用的实验方法耗时耗力,再加上当前科学技术的限制、时间和空间的制约,往往使鉴定的结果包含了大量的“假阳性”和“假阴性”数据,而且精度较低。因此寻求高效的计算方法来鉴定蛋白质相互作用位点就显得非常必要。在众多计算方法中,机器学习方法已经在蛋白质相互作用预测中得到了广泛的应用,而且也取得了较好的效果。本文使用构造性神经网络算法—覆盖算法、核覆盖算法和基于特征选择的多侧面递进算法对蛋白质相互作用位点进行了定位,取得了很好的效果。本文的主要工作分为下面几个部分:(1)介绍了蛋白质相互作用研究的背景、意义和研究现状。概述了蛋白质的基本概念和预测蛋白质相互作用的实验方法和计算方法。(2)主要介绍了覆盖算法及其改进算法,并建立预测模型对蛋白质相互作用位点进行预测。首先,概述了覆盖领域的几何意义,重点介绍了覆盖算法的改进算法—核覆盖算法,它集合了支持向量机和覆盖算法的优点,具有鲁棒性强,准确率高等优点。然后,利用核覆盖算法建立预测模型,对蛋白质相互作用位点进行鉴定,得到预测结果。对实验结果进行分析和讨论,并将实验结果和BP算法、SVM进行比较,体现出该算法的优越性。此外,在残基序列谱和序列信息熵两个蛋白质特征的基础上,引入残基可及表面积进行实验,验证了残基可及表面积对预测性能的贡献程度。(3)多侧面递进算法是一种分而治之的方法。首先按从主到次的不同角度进行分析,得出其基本特征,然后再综合分析。这样,不但能选择有效的维度、降低对象的维数,从而降低计算复杂性,而且能多角度匹配复杂问题,大大提高了泛化能力。而对蛋白质相互作用位点进行预测正是一个高维度,计算复杂的问题,因此本文首次尝试将多侧面递进算法应用于蛋白质相互作用位点预测研究中,利用该算法建立预测模型,对蛋白质相互作用位点进行预测。将实验结果和覆盖算法及其改进算法、BP算法和SVM进行比较,结果验证了多侧面递进算法在蛋白质相互作用位点预测的可行性和有效性。