论文部分内容阅读
社区结构(Community Structure)是复杂网络的一个重要特征,它具有社区内部节点连接相对紧密而社区之间节点连接相对稀疏的特点。发现网络中的社区结构对理解网络拓扑结构和挖掘网络底层隐含信息起着重要作用。因此,在复杂网络中进行社区发现算法研究成为近年来的研究热点之一。传统的社区发现算法主要研究非重叠社区结构的网络,即网络中的节点能且能归属于一个社区。然而,在现实世界的网络中,大多数实体都具有多种属性,抽象到复杂网络中,表现为网络节点可以同时属于多个社区,这使得研究重叠社区具有更现实的意义。目前而言,研究一模网络(即网络中只有一种类型的节点)重叠社区发现的算法已经有很多,这类算法主要存在两方面的不足:一方面,已有算法大多都是从宏观角度对复杂网络进行社区发现,然而,当网络中出现社区间边的密度高于社区内部边的密度时,这类方法就变的无能为力了;另一方面是随着网络规模的增大,这类算法消耗的时间往往呈非线性增加。近年来,研究者引入微观一模网络模型EgoNet,开辟了从微观角度来解决复杂网络社区发现问题的先河。EgoNet是由中心节点Ego、邻居节点Alter以及这些节点之间的边一起构成的微观网络模型。该模型可以有效的抽取网络节点间的微观特征,传统宏观角度的方法难以解决的问题,利用EgoNet却变得很容易解决。同时,很多已发表的研究成果也证明了基于EgoNet的社区发现算法在准确率上有很大的提高。鉴于EgoNet的上述优点,本文提出了一个微观二模网络模型Bi-EgoNet,并对其基本特性做了简单的研究。本文的主要研究内容是利用EgoNet和Bi-EgoNet模型对一模网络和二模网络中的社区发现问题进行研究。首先,研究了EgoNet在无向无权网络中的有效性,提出了基于亲密度的重叠社区发现算法OCDFI(Overlapping Community Detecting algorithm based on Friend Intimacy)。针对传统的基于EgoNet的社区发现算法中存在的合并社区负担重,且准确率不高等问题。本文利用EgoNet模型,从每一个EgoNet中只提取一个以Ego为中心的,朋友亲密度较高的局部社区。算法从每一个EgoNet中只提取一个社区,可以有效降低社区合并的负担。同时社区中只包含与Ego的朋友亲密度较高的Alter,可以确保这些Alter与Ego有较高的概率属于同一社区,这在一定程度上增加了发现社区的准确性。OCDFI算法在人工网络和真实网络中进行了验证,并与其他经典的算法比较,实验表明算法具有较高的准确性,平均准确性能提高13.39%。其次,研究了EgoNet在有向无权网络中的有效性,提出基于关注度的重叠社区发现算法OCDAD(Overlapping Community Detecting Algorithm based on Attention Degree)。所谓关注度是指如果节点A指向节点B,那么节点A就关注了节点B。一般而言,节点间关注度的影响会随着距离的增加而变弱。传统的关注度计算方法只考虑直接共同邻居节点的关注度,这在一定程度上降低了关注度计算的准确性。本文将Ego间接邻居ex-Alter加入到EgoNet模型,使其扩展为Ex-EgoNet模型。基于该模型,在计算Alter对Ego的关注度时除了考虑直接共同邻居的影响还同时考虑了间接共同邻居的影响。OCDAD在已知社区结构和未知社区结构的真实网络中进行了实验,与经典的有向网络社区发现算法OSLOM和Infomap相比,OCDAD算法在时间消耗上比OSLOM算法要少的多,比Infomap算法略差,但在平均准确性上都优于这两个算法,提高了约35%。再次,从微观角度研究了二模网络重叠社区发现问题,提出了基于Bi-EgoNet的重叠社区发现算法。二模网络是包含两种不同类型节点的特殊复杂网络。众所周知,利用EgoNet发现一模网络中社区结构的算法相对传统的算法而言,在准确性和有效性上都有较大的提高。然而,到目前为止,却没有看到可用于发现二模网络社区结构的微观网络模型。基于此,本文将EgoNet进行了扩展,并提出了微观二模网络模型Bi-EgoNet。同时,提出基于Bi-EgoNet的二模网络重叠社区发现算法OCDBEN(Overlapping Community Detecting Algorithm of bipartite network based on Bi-EgoNet)。在人工网络和真实网络中的实验结果表明,OCDBEN在时间和准确率上均优于其他算法:随着网络规模的增加,我们的算法在时间消耗上明显的少于其他两个对比算法(Cui’s method和Wang’s method),平均准确率上也提高了约15.71%。最后,提出了基于完全二分图的重叠社区发现算法OCDCBG(Overlapping Community Detecting of bipartite network based on Complete Bipartite Graph)。传统的基于极大完全子图(或派系)的算法在发现一模网络的社区结构中,有着较大的优势。完全二分图是一种特殊的二分图,其特性类似于一模网络中的完全子图,即完全二分图中每一个节点都属于同一个社区。基于此,本文将完全二分图的不可分割特性和Bi-EgoNet微观特性结合,提出基于完全二分图的二模网络重叠社区发现算法OCDCBG。在人工和真实的网络中的实验结果表明,OCDCBG算法均优于两个经典的算法(Cui’s method和Wang’s method),平均准确率提高了约21.41%。