基于蛋白质相互作用加权网络的关键蛋白质识别算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:chen3712331
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着蛋白质组学研究的推进,以及高通量实验技术的快速发展,蛋白质组学中关键蛋白质的研究进入了一个新的发展时期。关键蛋白质是生物体存活和繁殖所必需的蛋白质,在生命活动过程中有着举足轻重的地位。关键蛋白质的识别不仅有助于了解细胞新陈代谢、生长发育、分化和凋亡等活动过程,而且在研究疾病发生机理、发现药物靶点和研制新药等方面具有重大应用价值。随着蛋白质相互作用网络数据的不断增长,基于网络拓扑结构识别关键蛋白质受到广泛关注。但由于网络数据不完善和假阳性高等原因,现有的识别算法准确率依然较低。本文在蛋白质相互作用网络拓扑结构的基础上,考虑网络节点的生物功能和生物特性,引进基因本体数据和基因表达数据,构建加权蛋白质相互作用网络。在加权网络上基于局部网络拓扑结构识别关键蛋白质。具体有以下几方面工作:针对现有蛋白质相互作用数据假阳性高的问题,选取基因本体信息度量蛋白质相互作用对的功能相似性,给网络每条边赋予不同权值,构建加权网络。在加权网络上,考虑蛋白质节点的直接邻居和间接邻居节点对蛋白质关键性的不同影响,扩展局部网络拓扑至二阶邻居,并基于节点的度和边的双重特性,提出了新的关键蛋白质识别算法GO_ELAC,并用于识别关键蛋白质。实验结果表明,该算法比其他五种方法能识别更多的关键蛋白质,提高了算法准确率。蛋白质的关键性实际上是一种功能属性,但大多基于网络拓扑的关键蛋白质识别算法,对蛋白质生物意义和生物功能方面的挖掘不够深入。我们引入基因本体数据、基因表达数据和蛋白质相互作用网络数据结合来识别关键蛋白质。首先基于相互作用蛋白质对应基因表达数据的Pearson相关系数过滤蛋白质相互作用网络中的部分边,再引入基因本体数据衡量蛋白质相互作用对的功能相似性,结合蛋白质相互作用对的表达相关性,构建双权重网络。在双权重网络中同时考虑节点和边的特性,提出了改进的PeGO关键蛋白质识别算法。并在两个酵母数据集上测试PeGO算法的实验性能。实验结果表明,PeGO算法识别的关键蛋白质准确率高于其他六种方法,进一步证实了引入与蛋白质相关的生物信息,构造高可信度的加权蛋白质相互作用网络,进而基于加权网络识别关键蛋白质是可行且有效的。
其他文献
探井井位论证系统是油田数字化建设的重要组成部分,旨在满足油气田勘探开发业务数据共享、应用集成和研究一体化的需要,提高井位勘探开发成果数据收集、传输、存储、检索、显示
随着我国信息化的建设,网络的应用随之也更加的普遍并且几乎渗透到了社会的每一个角落。但是,网络技术带来便利的同时也带来了许多安全问题。尽管用户可以采用防火墙、入侵检测
完整的车牌字符识别系统(License Plate Character Recognizer,LPCR)包含字符图像预处理、字符特征提取和分类器判决三个阶段。在这三个阶段中,选取何种字符特征和字符识别方法
随着互联网和多媒体技术的发展,图像信息急剧增长,图像逐渐成为人们获得信息和了解世界的重要媒介。如何在浩如云烟的图像中获得自己需要的图像信息就成为亟待解决的问题。于是
随着信息技术的迅猛发展,图像处理技术在诸如军事防御、医疗诊断、气象监测等领域发挥着越来越重要的作用。作为一种基本的计算机视觉技术,图像分割是图像处理的关键技术之一
随着智能手机的推广与普及,通信必须依赖运营商提供服务的情况正在逐渐改变。目前,无运营商支持的智能手机通信技术主要有蓝牙、ZigBee、Wi-Fi、IrDA和VoIP。从以上几种技术来
外模式对应于用户级,是与某一应用有关的数据的逻辑表示,用户应用程序根据外模式进行数据操作。在理论上,应用程序开发应该针对外模式,而目前实际上都是针对的逻辑模式,并非
近年来,随着全球定位系统、地理信息系统、卫星数据处理、计算机辅助设计及移动计算等领域的迅速发展,针对移动对象的空间数据查询研究得到了国内外研究者的广泛关注,然而,随着移
面对快速增加的数据量,如何存储管理数据、如何保证数据的安全可靠成为数据拥有者比较关注的问题。因其可靠性、冗余性、高性价比、伸缩性和底层实现对用户的透明性,基于云的数
作物的三维信息获取在农田机械视觉导航及作物种植、收割、农药喷施、除草和蔬菜嫁接等方面的作用越来越大,可为现代农业作业提供作物生长的坐标信息,具有很大的应用前景。本