论文部分内容阅读
近年来,对于复杂网络的研究已经成为数学、计算机、物理等多学科交叉的热点研究领域之一。通过研究发现,复杂网络具有一些重要的性质比如小世界性质(Small World)、度序列幂率分布(Power-Law Distribution)、具有高的聚系度(High Clustering-Coefficient)等等。本文着重对复杂网络中的社区现象(Community Structure)性质。社区现象是指网络可以被划分为若干个模块,模块内部的节点连边比较紧密,但模块之间连边相对稀疏,它在社会网络、生态网络、生物网络、因特网中均被发现。生物信息学的发展更是给复杂网络的研究带来新的动力,近年来各种生物数据的快速增长尤其是网络数据的出现,使得人们可以站在一个系统的层面上了解生物体的发展,而生物网络中的社区现象无疑可以提供很有价值的信息。本论文中主要是研究了复杂网络中的社区现象以及更一般的结构,通过利用计算技术构建模型,主要取得了以下几个结果:
●提出了利用向量聚类的方法来研究网络的社区结构。利用矩阵奇异值分解将网络向量化,通过对这些向量聚类来探测网络的社区结构。这个思想提出了一个框架,该框架可以融入任何成熟的向量聚类方法,从而建立起向量聚类和网络社区探测之间的内在统一性。实验证明它具有很高的正确率并可以应用在赋权网络和有向网络。
●提出了一个基于EM(期望值-最大化)算法的概率模型SPAEM,该模型不仅可以高精度的探测网络社区结构,还能够揭示网络深层次的信息比如:揭示网络的交叉节点(overlapping node)、对网络中每条边的可靠性进行评估、揭示每个节点在模块内的重要程度等。通过利用最小描述长度原则,模型可以用来确定社区数量。同样,模型对于赋权网络的社区结构探测也有很好的效果。
●针对网络中的一般结构,提出了一个半参数化的概率模型。它不仅能够提供与SPAEM同样的信息,还能对网络的模式进行探测并给出不同的网络分割,通过最小描述长度原则,算法可以定量的判定不同分割与网络数据的吻合程度。通过在计算最小描述长度法则中设定不同的精度,算法能实现以层次化的方法来探索网络。
相比如前人的结果,提出的算法速度快,精度高,模型假设简明,能提供更详细的网络结构信息,并且适用于赋权网络和有向网络。未来的工作希望能提出精确的衡量社区现象的指标,这个指标能够克服当前算法的问题并可以适用于有向图和赋权图。