基于网络拓扑特性的关键蛋白质识别算法的研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:boguiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物信息学的迅速发展,人们对生物学的研究已经逐渐扩展到蛋白质组学的层面。关键蛋白质的移除会造成有关蛋白质功能模块的功能丧失,进而使细胞无法正常的进行生命活动,从而导致生物体无法生存。关键蛋白识别与保护是药物开发的基础,它对于理解细胞生命活动的必需物质具有十分重要的理论意义和应用价值。基于试验数据利用计算方法识别关键蛋白质可以极大地节省时间和资源,所以对蛋白质相互作用网络中的关键蛋白质进行识别是生物信息学领域的一个重要研究方向。目前,比较常用的关键蛋白质识别算法有:度中心性测度算法、接近度中心性测度算法、介数中心性测度算法、桥中心性测度算法、局部平均连接中心性测度算法、网络中心性测度算法等,但这些测度算法仅仅从蛋白质相互作用网络的全局信息或者局部信息对关键蛋白质进行识别。本文通过分析功能模块与关键蛋白质的关系,提出了一种能够从局部反映蛋白质相互作用网络中各蛋白质顶点拓扑特性的指标—局部系数,并设计了结合局部系数和点介数的中心性测度算法—LBC中心性测度算法。由于该算法不仅包含了蛋白质相互作用网络的全局信息,而且又融合了蛋白质分子的局部信息,所以能更全面的对关键蛋白质进行识别。试验结果表明,在无标度网络中,LBC算法的关键蛋白质识别率比上述六种测度算法高10%以上。并且在算法的稳定性和普遍性方面,LBC算法也优于上述六种测度算法。由于LBC算法中的介数中心性计算的时间复杂度较高,所以本文从两个方面对其进行了改进。一方面是对算法本身进行改进,在计算介数中心性时利用VC维理论控制样本大小只对部分最短路径进行计算,使得在精度降低不大的情况下大幅度提高了计算效率。另一方面利用GPU对算法进行加速,设计并实现了基于CUDA架构的介数中心性算法,通过GPU硬件加速。试验结果表明,基于CUDA的LBC算法在保证检测精度不变的情况下将计算时间缩短了20-100倍。
其他文献
随着动车组的快速发展与普及,在动车组关键部件管理过程中,产生了大量的数据,产品离开关键部件生产厂家后,因为时间和空间的限制,各阶段之间存在着信息差,无法真正实现产品数
本论文以面向MES的人力资源管理系统为研究对象,以构建行之有效的人力资源管理领域架构及可复用的领域构件为研究目标,系统地进行了中小型制造企业人力资源管理特征研究、基于
近来,随着手机等便携式摄像设备的发展,涌现出海量的非专业视频,其普及度之广,已经对人们的生活产生极大影响。非专业视频往往抖动大、可观赏性不高。因此通过一定手段优化增
随着量子计算与量子信息的深入发展,量子可逆电路的应用越来越多。可逆电路实现的是一个双射的可逆逻辑函数功能。由于它的可逆计算的功能,可逆电路不仅能够应用在量子计算,它同
河流相储层在我国石油工业中占有非常重要的地位,由于其储层非均质性严重,很难对其进行定量描述。基于等时建模原则应用随机游走方法对河流相储层进行三维建模,可以充分利用
网格变形是将三维几何模型从一个动作序列变换到另一个动作序列的过程,是三维模型处理领域中的重要组成部分。网格变形技术是近年来计算机图形学中的研究热点之一,很多研究成
目标识别与跟踪技术涉及到计算机数字图像处理、模式识别以及人工智能等诸多领域,广泛应用于军事、工业、生活等各个方面。本文以起飞的飞机为目标进行研究。研究内容分为三
二十一世纪是数据和信息化的时代,各类数据库和信息系统的建立提高了人类分析数据并进行决策的能力。由于数据量的急速增加,如何从大规模数据中挖掘出数据所蕴含的信息成为了
星表是记载天体各种参数(如位置、运动、星等、光谱型等)的表册。它真实地反映了一定时期内,天文学家在天体测量方面所取得的成果。星表是天文学家最常用到的天文数据,因此很
公文流转系统是一个办公自动化系统中的通用构件,而且是一个非常重要的构件,一个优秀的公文流转系统可以很好的和OA协同,大幅度提高OA内的信息共享、人员协作与业务监督的效