基于覆盖算法的蛋白质相互作用位点预测

来源 :安徽大学 | 被引量 : 0次 | 上传用户:luanwf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生物功能的主要体现者和执行者,正是它们之间的相互作用实现了生物体的功能。对蛋白质和蛋白质相互作用的研究,不但有助于蛋白质功能分析、生命活动机制的理解,而且对于疾病诊断和药物设计有重要的现实意义。然而传统的鉴定蛋白质相互作用的实验方法耗时耗力,再加上当前科学技术的限制、时间和空间的制约,往往使鉴定的结果包含了大量的“假阳性”和“假阴性”数据,而且精度较低。因此寻求高效的计算方法来鉴定蛋白质相互作用位点就显得非常必要。在众多计算方法中,机器学习方法已经在蛋白质相互作用预测中得到了广泛的应用,而且也取得了较好的效果。本文使用构造性神经网络算法—覆盖算法、核覆盖算法和基于特征选择的多侧面递进算法对蛋白质相互作用位点进行了定位,取得了很好的效果。本文的主要工作分为下面几个部分:(1)介绍了蛋白质相互作用研究的背景、意义和研究现状。概述了蛋白质的基本概念和预测蛋白质相互作用的实验方法和计算方法。(2)主要介绍了覆盖算法及其改进算法,并建立预测模型对蛋白质相互作用位点进行预测。首先,概述了覆盖领域的几何意义,重点介绍了覆盖算法的改进算法—核覆盖算法,它集合了支持向量机和覆盖算法的优点,具有鲁棒性强,准确率高等优点。然后,利用核覆盖算法建立预测模型,对蛋白质相互作用位点进行鉴定,得到预测结果。对实验结果进行分析和讨论,并将实验结果和BP算法、SVM进行比较,体现出该算法的优越性。此外,在残基序列谱和序列信息熵两个蛋白质特征的基础上,引入残基可及表面积进行实验,验证了残基可及表面积对预测性能的贡献程度。(3)多侧面递进算法是一种分而治之的方法。首先按从主到次的不同角度进行分析,得出其基本特征,然后再综合分析。这样,不但能选择有效的维度、降低对象的维数,从而降低计算复杂性,而且能多角度匹配复杂问题,大大提高了泛化能力。而对蛋白质相互作用位点进行预测正是一个高维度,计算复杂的问题,因此本文首次尝试将多侧面递进算法应用于蛋白质相互作用位点预测研究中,利用该算法建立预测模型,对蛋白质相互作用位点进行预测。将实验结果和覆盖算法及其改进算法、BP算法和SVM进行比较,结果验证了多侧面递进算法在蛋白质相互作用位点预测的可行性和有效性。
其他文献
学位
图像和视频作为计算机科学领域的重要研究对象,近年来一直是研究热点。而随着图像和视频处理技术的迅速发展,对图像和视频质量提出了更高的要求,高分辨率图像和视频包含的细
随着嵌入式系统的发展,嵌入式系统已经广泛的应用到科学研究、工业控制、军事技术以及人们的日常生活等各个方面。尤其在实时领域,基于实时的嵌入式操作系统也得到了更多的应
本文在对数字水印算法研究的过程中,发现水印容量、不可见性、稳健性三者很难达到平衡,顾此失彼,影响数字图像在互联网传播的版权认证,从而需要改进数字水印嵌入、检测算法。
Dennis Gabor在1946年提出的Gabor变换在非平稳信号处理中是非常有用的,它克服了传统Fourier变换不能表示一个信号的频率如何随时间变化的缺点。Gabor变换系数揭示了一个信号
随着互联网技术的迅速发展,人们希望越来越多的业务在互联网上进行。但互联网是一个开放的网络,存在各种安全威胁。为了保障用户数据的安全,各种技术应运而生。作为安全技术
纺织工业是我国传统的支柱产业之一,从纺织原料和化纤生产开始,出现了纺纱、织布等生活中常见的纺织品加工形式。但是由于纺织原料本身信息指标繁多,而且生产过程中,纺织原料
文本中含有大量对分类有贡献的信息,能否综合利用这些信息选取一种合理的文本表示方式,是文本分类的难点和关键。单纯的使用传统的向量空间模型VSM(Vector Space Model)表示
随着后PC时代的到来,嵌入式系统在各个领域得到广泛的应用,新型化、智能化的嵌入式系统成为了研究的热点。然而,由于嵌入式系统应用的广泛性以及硬件平台的多样性,严重制约着
节能减排、产品质量和安全追溯等战略,对开放环境下全供应链信息共享提出需求。论文基于课题组前期研究成果——ORFP体系,以离散制造业为背景,研究企业信息服务模型及事件检测方