蛋白质相互作用网络中复合物识别算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:suzhenzsyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质复合物是由多个蛋白质在相同时间和空间上通过相互作用结合在一起形成的一组稳定蛋白质。目前,通过实验获得的蛋白质复合物数目有限而且成本代价较高。因而,利用计算方法对蛋白质复合物进行识别具有重要的实际意义和应用价值。本文从四个方面对蛋白质复合物识别方法进行研究,主要内容如下:第一,蛋白质复合物识别通常是利用蛋白质相互作用网络中的拓扑信息进行图聚类,较少考虑到蛋白质氨基酸序列中的背景频率对复合物识别的影响。针对这个问题,本文提出基于融合特征的局部搜索图聚类算法。首先,在特征提取的过程,融合蛋白质序列信息中氨基酸的背景频率和网络中的拓扑信息。其次,在定位蛋白质复合物的算法中引入相似性度量(即余弦相似性)。最后,在复合物的判断部分,利用拓扑和生物特征同时对识别到的簇进行判断,并且允许不同蛋白质复合物彼此交叠。实验结果表明:算法能够有效地匹配更多的真实蛋白质复合物。第二,蛋白质复合物在相互作用网络中存在多种拓扑形态,如线型、星型、全连通型和混合型等,不能用统一形式描述其拓扑结构。因此,本文提出基于支持向量机有监督图聚类算法。同时,基于局部搜索图聚类算法中生物信息的有效性,加入序列特征。首先,统计真实复合物长度分布的特点,从蛋白质相互作用网络中随机生成反例集合。其次,设计基于有监督的融合拓扑和生物特征的有效的识别算法。最后,在算法识别的过程中利用拓扑约束和支持向量机判断识别到的蛋白质簇。实验结果表明:基于支持向量机的有监督图聚类方法在F-Measure方面较其他几个经典算法具有更好的表现性能。同时,通过实例分析证明算法有利于识别混合拓扑结构的复合物。第三,由于蛋白质相互作用网络的数据中含有噪声数据,使得预测的结果往往不够准确。而且,常用的识别算法往往基于单一的相互作用数据集。针对此问题,本文提出结合多数据源信息的有权图复合物识别算法。构建三个有权图:基于基因本体的蛋白质有权相互作用网络、基于von Mering相互作用置信度的有权蛋白质相互作用网络和融合von Mering与基因本体信息的有权图相互作用网络。实验结果表明:基于融合的有权图识别方法在召回率、准确率和F-Measure方面均能有效提升复合物的识别性能。第四,复合物的形成不仅受到拓扑信息的影响,同时也受到空间信息的约束。目前,大部分识别方法只提取局部密集区域的网络来识别蛋白复合物,并且主要基于蛋白质相互作用之间的拓扑信息,没有考虑蛋白质复合物内部的蛋白质之间空间结构的限制,这使得识别到的复合物不可避免的存在一些假阳性的数据。基于此问题,本文引入亚细胞空间信息来识别蛋白质复合物,主要研究内容包括:基于排序策略的复合物识别和融合策略的复合物识别。在基于排序策略方面,首先,在相互作用网络上得到候选蛋白质簇的集。然后,利用排序策略筛选,有效过滤假阳性的复合物。融合空间特征方法在拓扑和空间信息的网络上识别候选簇,通过合并策略得到最终的簇。此方法能够有效地提升L、CFinder、MCODE和MCL算法在F-Measure评价的表现性能。最后,详细阐述论文中提出的四个算法的特点,分析它们之间的相互关系和应用场合。
其他文献
小儿体质轻灵 ,为“稚阴稚阳”之质 ,其发病“易虚易实 ,易寒易热”。临床最难调治。桂枝汤为群方之祖 ,有调和营卫之功。做为治疗儿科急重证基础方 ,随证变化 ,取得了较好的
<正> 2002年6月14日,火星和木星轨道间一颗巨大的小行星掠过地球,与地球的最近距离仅为120697.5千米。科学家们说,这种事情还会发生。
人类视觉感知系统能够轻易地从外部复杂场景中感知静止或运动的目标,然而该感知过程对计算机来说并非易事。作为计算机视觉领域中的研究热点和难点之一,目标检测与识别长期以
基于视觉的运动人体行为识别是计算机视觉和机器学习等领域的热门研究方向,在智能监控、人机交互等方面有着十分重要的应用价值。本文在运动目标的检测、特征提取和描述、人
综合实践活动课程的教师指导应是基于信任的倾听和渗透思考的指引,具有具体性、生成性和互动性等特点。在综合实践活动课程实施的活动准备阶段、实施阶段和总结阶段,教师指导
伊东&#183;布拉格是美国历史上第一位获得普利策奖的黑人记者。一次,有人问他是如何取得如此成绩的,布拉格沉思片刻,讲了这样一个故事。
从监管方式看,我国公立医院目前主要是政府主导行政管制,表现出了监管越位、错位和缺位的属性,这已成为顺利推进医改的阻碍因素之一。鉴此,需要通过明确监管目标、科学界定政
迎着二〇一九年初升的太阳,让我们轻轻地作个道别,说一声:“再见,二〇一八。”在这辞旧迎新的美好时刻,《医学与法学》期刊向广大读者、作者以及支持我们的领导、专家、学者
期刊
随着能源和环境问题越来越严重,各国都在思考建筑领域方面节能和环境保护的突破点。因此,自上世纪七十年代以来,各国将关注的重点放在了节能建筑、低能耗建筑上,并进行了卓有
本文针对来自企业模具中一精度要求较高零件的对称度而采用精密检测手段——三坐标测量仪进行检测,文中着重从检验调研、检验实施到检验分析三个阶段对零件检测的工艺过程进