论文部分内容阅读
生物信息学是在生物科学的研究过程中,以计算机为工具对海量生物数据进行存储、检索与解析的科学,通过对生物学实验数据的存储利用及信息挖掘,达到揭示这些数据背后所蕴含的生物学知识的目的。蛋白质的生物学功能与其空间结构有着密切的关系,因此掌握蛋白质的空间结构信息对于研究蛋白质的功能及其作用机理具有重要意义。然而由于目前用于测定蛋白质结构的生物学试验方法存在代价高、速度慢等缺点,因此开发理论层面上的蛋白质结构预测方法势在必行。本文以现代计算智能技术为基础,对蛋白质空间结构预测方法进行了较为深入的研究,本文主要从以下几个方面进行了研究与探讨:针对离散型蛋白质HP格点模型,本文提出了一种融合改进量子遗传算法及局部搜索策略的蛋白质HP格点模型预测方法。该方法在传统的量子遗传算法基础上引入动态调整量子门旋转角步长机制用来提高算法的优化性能,并且按照一定规则对量子遗传算法的优化结果进行局部结构变换,这种结构变换只需通过移动较少的节点就可以实现,实验表明该方法能够有效改善算法的优化结果。针对连续型蛋白质HP非格点模型,本文提出了一种融合改进模拟退火算法与序列二次规划法的预测策略。将序列二次规划法加入具有回火功能的模拟退火算法中,利用其局部最优化的能力对由模拟退火算法求得的优化结果进行二次优化,进而求得全局最优化结果,并且针对不同的优化过程分别设计了不同的扰动方式。实验结果表明,该方法能够有效提高蛋白质HP非格点模型的优化结果。针对蛋白质填充结构,本文提出了一种基于样本选择的蛋白质填充结构预测方法,该方法首先根据蛋白质填充结构定义从立体结构已知的蛋白质中抽取用于分类学习的样本集并对其进行编码,然后基于信息粒度理论运用聚类分析的方法将编码后的训练样本划分为若干类别,进而使用最近邻算法从分类后的初始训练样本集中选择最具有代表性的样本作为分类器的训练样本,构建蛋白质填充结构预测模型。实验结果表明,该方法能够有效提高蛋白质填充结构的预测精度。针对蛋白质二硫键结构,本文提出了一种基于分类器融合技术的蛋白质二硫键结构预测方法。该方法基于FDOD函数、蛋白质氨基酸序列以及蛋白质生物化学属性,采用不同的编码方式分别设计了三种不同的蛋白质二硫键结构分类器,然后依据多分类器融合理论,对它们进行分类器融合,获得最终的蛋白质二硫键结构预测结果。实验结果表明,该方法能够有效的提高蛋白质二硫键结构的预测精度。