论文部分内容阅读
随着社交时代的到来,社交网络分析逐渐成为研究热点,在社交网络研究的众多问题中,社区的发现与演化分析是一个典型问题。相比较其他复杂网络,社交网络在节点的多样性和结构的动态性方面表现得更为复杂。发现并分析社交网络中的社区演化过程,有助于在中观层面上加深对社交网络的认识,同时,社区分析的结果对其他领域的研究有极大的帮助作用。本文的研究内容包括以下几个方面:(1)针对现有静态社区发现算法在种子节点选择过程中存在的稳定性差和扩展过程易受处理顺序影响进而导致划分结果准确性较差的问题,提出了一种基于Node2Vec的重叠社区发现算法。首先,利用Node2Vec算法得到网络中每个节点的向量表示并计算任意两个节点间的相似度。然后,利用本文改进的节点影响力函数计算出各节点的影响力值,选择局部影响力值最大节点作为种子节点,并根据节点间相似度将待更新节点划入相应社区,直至所有节点都归属于至少一个社区。实验表明,该算法能够在保证稳定性的前提下,更加准确地挖掘出社交网络中的社区结构。(2)针对现有增量式动态社区发现算法存在的容易发生错误信息积累和社区发现结果易受增量顺序影响等问题,提出了一种基于种子节点重新选择与扩展的增量式动态社区发现算法。将增量本身及其可能影响到的节点全部标记为待更新状态,通过扩大增量影响范围的方式降低错误信息积累的可能性,并通过比较待更新节点与每个种子节点间的相似度与阈值的大小关系,独立地对待更新范围内的节点进行划分,避免了增量顺序可能对实验结果产生的影响。实验表明,本文所提出的算法在人工数据集和真实数据集上均表现出更高水平的稳定性和准确性。(3)将种子节点的思想与社区演化分析过程相结合,提出了一种基于种子节点比较的社区跟踪策略。通过比较相邻时刻网络之间种子节点的关系分离出相互独立的社区演化序列,在每个社区演化序列上,独立地分析各类社区演化事件的发生情况,然后将信息汇总,进而结合网络背景信息进行各类演化事件的相关分析。