基于烟花算法的PPI网络功能模块检测方法研究

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:yingzi9252
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质相互作用(Protein-Protein Interaction,PPI)网络是指一个生物体内的所有蛋白质之间相互作用组成的网络。蛋白质功能模块是指PPI网络中通过相互作用完成某一特定生物功能的蛋白质集合。在PPI网络中挖掘蛋白质功能模块是蛋白质组学研究的一个重要内容,它不但有助于人们从分子水平上理解生命的运行机制,而且对于疾病诊断和研发新药具有十分重要的意义。因此,为了有效地检测出PPI网络中的蛋白质功能模块,以聚类机理为基础的计算方法迅速发展。其中,利用群智能寻优机制的求解方法表现出了不错的效果。本课题基于烟花算法(Fireworks Algorithm,FWA)开展了以下两个方面的研究工作:(1)提出了一种基于烟花算法的PPI网络功能模块检测方法(Fireworks Algorithm for Functional Module Detection in Protein-protein Interaction Networks,FWA-FMD)。首先,结合PPI网络的拓扑结构信息和基因本体的功能注释信息,利用标签传播思想将每个烟花个体初始化为一种候选的功能模块划分;其次,在每一代进化过程中,利用具有局部搜索和全局搜索自调整能力的爆炸操作对每个烟花个体进行优化,并采用精英保留和轮盘赌策略选择下一代烟花个体;最后,通过将最优烟花个体中标签相同的节点划分到同一功能模块,以得到最终的功能模块检测结果。在酵母菌和人类两个物种的四个公共PPI网络数据集上的实验结果表明:FWA-FMD算法不但求解时间少于遗传算法、蚁群算法和细菌觅食算法,而且在多项评价指标上与一些经典算法相比都具有明显的优势,能够更好地识别功能模块。(2)针对FWA-FMD容易陷入局部最优的缺陷,提出了一种融合差分进化策略的PPI网络功能模块检测的烟花算法(Fireworks Algorithm with Differential Evolution Strategies for Functional Module Detection in Protein-protein Interaction Networks,FWADE-FMD)。该算法以烟花算法为基本框架,重新设计了一种基于节点影响力的爆炸操作,充分利用了PPI网络中节点的邻域信息,同时引入差分进化算法的三个策略:变异、交叉和选择,增加了种群的多样性,扩大了搜索范围。首先,利用FWA-FMD的种群初始化方式初始种群;其次,利用基于节点影响力的爆炸操作生成爆炸火花,并采用精英保留和轮盘赌选择策略产生中间群体;然后,通过差分进化算法的变异操作、交叉操作和选择策略对烟花算法产生的中间群体做进一步优化;最后,通过将种群中的最优个体进行解码,完成PPI网络功能模块检测。在四个数据集上的实验结果表明:FWADE-FMD算法不仅能获得比FWA-FMD算法更好的解性能,而且在整体性能上与一些经典算法相比具有明显的竞争力。
其他文献
神经祖细胞(Neural Progenitor Cell,NPCs)是中枢神经系统(Central Nervous System,CNS)中一种特殊类型的专能干细胞,具有自我更新和定向分化为星型胶质细胞(Astrocyte,Ast),少突胶质细胞(Oligodendrocyte,OL)和神经元(Neuron,Neo)的能力。NPCs不仅作为哺乳动物CNS发育早期的神经发生细胞,在成熟的CNS中,N
AADL(Architecture Analysis and Design Language)是一种用于描述复杂嵌入式系统体系架构的建模语言国际标准,被广泛用于安全关键系统的建模与验证。AADL通过系统、子系统、
文本分类是许多自然语言处理应用中的一项基本任务。面对互联网上呈爆炸式增加的文本资源,如何利用文本分类技术,合理高效地对这些资源进行管理以及分类,挖掘其中潜在的商业
实域是指-1不能表示成平方和的域。实闭域是指没有真的实代数扩域的实域。实数域与实代数数域是实域和实闭域的主要例子。本文用R表示实闭域。实域和域的主要区别在于是否存
在中国古代文学叙事体式的发展过程中,诗与文相结合的形式是一种常见的、重要的叙事模式,这种体式在小说文体中的表现更为明显。作为早期文言小说作品的魏晋南北朝志怪小说,
胡克最初是菲律宾共产党在抗日期间组织成立的抗日武装,二战后胡克为了要求农业改革和反抗政府的暴力镇压,发展成为反政府的胡克运动。胡克运动迅速发展的背后反映了菲律宾严
在化学生产以及生物制药过程中,随着化学反应的不断进行,晶体的形貌会发生不断变化,为获取理想的产物,需要对晶体结晶过程进行监控,获取晶体在反应过程中的各种生长信息以控
信息时代,摄影作为一种记录媒介,已经逐渐成为人类观看方式的延伸并渗透进了我们的日常生活。摄影术诞生至今短短的一百多年间,我们的社会已经积累了无数的照片。从传统摄影
随着基因测序技术的发展,基因数据呈现出迅猛增长的趋势,在这种情况下,通过生物学实验方法发现相似基因效率比较低,而基于异质网络结构研究基因相似性搜索算法已经成为生物信息学研究的热点。在基因-疾病-表型形成的异质网中,挖掘疾病、表型间潜在的关联信息、合理量化节点间链接权重对基于pathSim算法探究基因相似性起到了至关重要的作用。然而,现有研究在基于pathSim算法探究基因相似性时很少考虑以上两个因
随着云存储技术的发展,越来越多的用户选择将自己的数据存储在云端。因此,云存储服务的易用性与安全性面临更多的挑战。为降低用户对数据安全性的担忧,云服务商所提供服务需要满足更高的安全标准。为保护用户数据的隐私,云端存储数据通常需要进行加密处理。然而,传统的加密算法会隐藏数据的大部分信息,所生成密文难以实现搜索比较等操作。因此,可搜索加密技术应运而生。为提高密文搜索算法的灵活性与安全性,本文对不可信环境