论文部分内容阅读
蛋白质相互作用(Protein-Protein Interaction,PPI)网络是指一个生命有机体内所有蛋白质之间相互作用组成的生物分子关系网络。利用计算方法进行PPI网络功能模块检测是后基因时代生物信息学领域一个活跃的研究领域。近年来,新的计算方法不断涌现,但随着网络规模逐渐增大,如何快速准确地识别PPI网络功能模块仍然是一个有重要意义的研究课题,吸引着研究人员的研究兴趣。多标签传播机制是由标签传播算法转化而来,通过模拟实际网络中节点同时属于多个类别的现象来寻找问题的最优解。该算法收敛速度较快,但容易陷入局部最优。蜂群优化算法是一种全局优化的群智能算法,许多研究已经表明该算法能够在有限次迭代中找到全局最优或近似全局最优解,但是它的求解是一个基于种群的迭代寻优过程,需要花费较多的时间。本课题在深入研究多标签传播算法和蜂群优化算法的基础上,提出了两种高效的PPI网络功能模块检测方法:(1)受多标签传播算法在复杂网络社区发现问题上具有快速、高效求解能力的启发,本文提出了一种基于多标签传播机制的PPI网络功能模块检测方法(MLP-FMD)。首先,我们结合PPI网络功能信息和结构信息来初始化节点的标签;然后,依据蛋白质之间的共表达性构建标签集合,并根据节点的阈值从中选择标签以实现标签的更新和传播;最后,将具有相同标签的蛋白质节点归属于同一功能模块,从而获得模块检测结果。在三个PPI数据集上的结果表明MLP-FMD算法不仅具有良好的时间性能,而且在检测精度上具有一定的竞争力。(2)针对多标签传播机制容易陷入局部最优的缺陷,我们进一步提出了将多标签传播机制与人工蜂群算法相结合的功能模块检测算法(LPABC-FMD)。首先,算法利用多标签传播机制初始化种群,既得到了质量较高的初始种群,又成功降低了求解问题的规模;然后,利用人工蜂群算法中雇佣蜂、观察蜂的邻域寻优操作和侦察蜂的全局搜索,优化种群的质量;最后,根据自动解码机制得到初始功能模块,并通过合并、过滤机制得到最终的模块。我们将LPABC-FMD算法与MLP-FMD算法在多个数据集上进行了实验,结果表明LPABC-FMD算法能有效地跳出局部最优。与一些经典算法相比,LPABC-FMD算法检测到的功能模块的质量也具有明显的优势。