大规模蛋白质相互作用网络复合物挖掘算法研究

来源 :中南大学 | 被引量 : 4次 | 上传用户:leolover211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,生命医学研究正处于后基因组时代。系统地分析和全面理解蛋白质之间通过相互作用完成生命活动的规律成为最热的研究问题之一。特别是,从大规模蛋白质相互作用网络中识别蛋白质复合物对预测蛋白质功能、解释特定的生物进程具有重要意义。   针对算法CPM应用于蛋白质相互作用网络时,蛋白质复合物识别准确率不高等缺陷,通过引入距离限制条件约束蛋白质复合物的规模,进而提出了基于团渗透和距离限制的蛋白质复合物识别参数算法CPM-DR与非参数算法CP-DR。基于酵母蛋白质相互作用网络平台的实验结果表明,CPM-DR和CP-DR都比CPM能够更准确、更有效、更全面的识别出具有特定生物意义的蛋白质复合物。   针对传统的基于密度的局部搜索方法忽略了边缘蛋白质结点、稀疏的真实蛋白质复合物、没有考虑蛋白质对生命活动的基本差异等缺陷,提出了基于关键蛋白质和局部适应的蛋白质复合物识别算法EPOF,并将其应用到加权和非加权的酵母蛋白质相互作用网络。实验结果表明,EPOF相比于其他算法具有更好的性能。此外,EPOF能够识别具有生物意义的低密度蛋白质复合物。更进一步,EPOF验证了关键蛋白质在蛋白质复合物识别研究中具有极其重要的作用。   针对蛋白质相互作用的动态性、可利用的蛋白质相互作用数据的不完全性和存在噪声等众多问题,通过融合组织特异性的基因表达数据和人类静态蛋白质相互作用网络,提出了基于组织特异性和局部适应的蛋白质复合物识别算法TSOF。将TSOF应用到人类静态蛋白质相互作用网络的实验结果表明,TSOF识别的蛋白质复合物具有很强的生物意义。此外,TSOF验证了组织特异性蛋白质相互作用在蛋白质复合物识别研究中具有极其重要的作用。   本文提出的几个蛋白质复合物识别算法从不同角度出发,有效地解决了蛋白质相互作用网络聚类过程中存在的一些问题,识别的蛋白质复合物从统计意义上被证明是有生物意义的,对生物实验具有积极的指导意义。
其他文献
Malware detection has become more difficult with the use of compression,polymorphic methods and techniques to detect and disable security sottware. Those andoth
随着信息量剧增,并且需要处理的事务增多,存储相关的数据也成为各行业的中心,例如银行、金融、政府、教育等领域,一旦这些数据损坏,将会造成不可估量的损失。存储区域网络(St
随着人类人口快速增加,城市化进程的加快和工业水平的提高,大气中灰霾污染日趋严重,为了加强对灰霾的监测和治理,开展灰霾等级的预测意义重大。   本文通过将美国环保署开发的
随着网络的发展,因特网成为目前使用最广泛,规模最大的信息源,为了方便、高效的从网络上获取所需要的信息,人们广泛使用搜索引擎来进行信息搜索。然而搜素引擎搜索出来的信息都是
H.264是MPEG和VCEG联合开发的视频压缩编码标准,其性能远远高于早期的MPEG-4和H.263编码,在2003年被ITU-T通过并且在国际上正式颁布。H.264具有高效的编码效率及网络亲和力,
作为自然语言处理的一个研究重点,语义角色标注(Semantic Role Labeling,简称SRL)是浅层语义分析的一种实现方式,它标注出句子中与谓词(可以是动词或名词等)相关的语义角色,
随着智能移动设备的日益普及,移动互联网技术的迅速发展,出现了各种各样的移动应用,而这些应用多数都是计算密集型的。为了获取良好的用户体验,移动设备就必须拥有较高的配置
加壳技术是保护软件知识产权的常用方法,但是常被恶意代码用来躲避杀毒软件的检测,因此对脱壳技术的研究是恶意代码分析的重要部分。当前已有很多有效的脱壳技术,例如定向脱壳技
聚类分析是数据挖掘的一个重要研究领域,已被广泛应用于统计学、生物学和市场营销等领域。目前学者已经提出了许多聚类算法。然而传统的聚类算法常常遭遇“维度效应",导致算
视频序列图像中对运动目标进行检测与跟踪是计算机视觉研究中一个相当活跃的领域,其目的是使计算机通过视频序列图像认知场景中的信息,并为图像分割、图像理解、行人识别、行为