基于蛋白质网络中复合体的识别方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:liongliong544
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,伴随着蛋白质组学和系统生物学研究的逐步深入,利用蛋白质相互作用网络识别复合体逐渐成为生物信息学的一个研究热点。高通量大数据实验产生大量蛋白质数据,其中势必包含大量假阳性的数据,假阳性数据定会影响到计算方法搜索复合体的最终效果。因此,采用计算方法来搜索复合体之前需要去除假阳性的影响。本课题对蛋白质网络中相互作用的蛋白质进行研究,运用计算聚类方法从中搜索出蛋白质复合体,其中研究的主要要点包括以下两点:(1)为了减少通过高通量大数据实验发现的蛋白质数据中假阳性的影响,从而提升搜索蛋白质复合体识别的精度,本章中我们提出了一种新的搜索蛋白质复合体的算法:MCLAd。首先,基于蛋白质相互作用网络拓扑结构的特性,选择处理网络拓扑特性方法AdjstCD对所得到的高通量蛋白质相互作用数据进行预处理,减少数据的假阳性;其次,再结合经典的MCL聚类算法进行蛋白质复合体的聚类识别;最后,将我们的算法MCLAd和现有的7种优秀方法:MCL,ClusterONE,MCODE,RRW,RNSC,COACH 以及 CORE 算法分别进行了实验比较。通过大量实验验证显示,本论文所提出来的MCLAd搜索算法具有非常明显的实验效果,对搜索蛋白质复合体有非常好的实验性能。(2)集成ClusterONE,MCL和RRW三种方法的优势,我们提出了一种新的蛋白质复合体搜索算法MCR,并且将MCR分别同MCL,COACH,ClusterONE,MCODE,RRW,RNSC,CORE以及我们所提出的MCLAd方法进行实验比较。我们将上述算法分别作用在BioGRID蛋白质相互作用数据库和DIP蛋白质相互作用数据库这两个数据集上,并且将搜索所得的结果即蛋白质复合体分别同SGD以及MIPS这两种复合体标准数据集进行实验比较。实验表明,同其他搜索蛋白质复合体算法相比,MCR算法搜索出的蛋白质复合体同标准复合体数据集匹配,在搜索效率以及可靠性上面都具有非常大的优势。
其他文献
近年来,随着无线通信技术的快速发展,基于LED的可见光通信(VLC)技术引起了企业和科研院所的关注。比较当前流行的无线电射频通信系统,可见光通信拥有高带宽和速率、高发射功
目的通过复制小鼠低氧预适应模型和建立体外低氧预适应细胞模型实验,研究错构素(Hamartin)及其DNA甲基化在低氧预适应神经保护中的作用,探索Hamartin在低氧及低氧预适应下发
吡咯喹啉醌(pyrroloquinoline quinone,PQQ)是一种热稳定、水溶性的三环邻醌。它主要作为各种细菌脱氢酶的氧化还原辅因子起作用,属于烟酰胺嘌呤(如NAD)和黄素依懒性辅助因子
稻瘟病已成为水稻生产最具破坏性的病害之一,可导致水稻减产15%以上。选育抗谱广、抗性持久的抗稻瘟病水稻新品种是防治稻瘟病最经济、绿色环保的有效途径。杂交水稻品种“丰
随着付费电视、视频点播(VoD)和视频监控等视频业务的推广,视频的版权和隐私保护成为了一个关注的热点。为了保证视频在传输、存储过程中不被非法复制、截取、传播,视频加密
植物内源sRNA(smallRNA,小RNA)在调控基因表达过程中起重要作用,它们可以通过激活或抑制特定基因的表达,从而影响植物的多个生物学过程。其中,sRNA在植物病原菌互作中的调控
随着互联网与无线网络的广泛普及,日益发达的资讯时代便利了人们的生活,随之而来的网络安全问题也日益凸显,例如,通过窃听进行的恶意破坏给整个通信网络安全造成了严重的隐患
随着市场竞争日趋激烈,组织网络日益成为一种重要的商业运行形态。组织网络的形式具有多样化的特点,组织网络中的网络决策也成为决策者需要考虑的问题。处于网络中的企业受网
大熊猫是世界生物多样性保护的旗舰物种,每天食入约12.5 kg竹子。大熊猫肠道结构短不能消化其中的大部分纤维素,依赖于肠道菌群。枯草芽孢杆菌能形成芽孢,分解纤维素,协助大
小麦是世界上重要的粮食作物之一。由亚洲镰刀菌引起的小麦赤霉病(Fusariu m Head Blight,FHB),在我国的发病面积大、危害重,赤霉病流行不仅引起小麦减产甚至绝产,还产生大量