论文部分内容阅读
随着生物信息学的发展,人们研究集中在蛋白质和DNA等生物大分子。蛋白质分子在生物体内执行着各项重要任务,而蛋白质相互作用是维持细胞结构和功能的基础,因此对蛋白质相互作用网络的研究具有重要意义。其中一类很重要的研究工作就是对蛋白质相互作用网络进行比对分析,通过网络比对可进行蛋白质功能预测以及保守功能模块的挖掘等。 蛋白质相互作用网络比对的一个关键问题就是计算蛋白质的相似度,它一般是通过蛋白质的序列比对得到的,但其应用具有一定的局限性,于是本文提出了一种基于图的蛋白质相似度计算方法GSim,它综合了蛋白质序列的相似性以及蛋白质相互作用网络的特性,并通过实验证明这种计算方法更加科学。 现有一种网络比对算法把比对问题转化成矩阵的特征值问题,通过求解得到两个网络比对的相似性向量,然后提取蛋白质的映射关系,最后挖掘保守模块。本文改进了该算法,加入了邻居蛋白质之间的序列相似性,并在fly和yeast两个物种的蛋白质相互作用网络中分别对改进前后两种情况进行实验分析。