论文部分内容阅读
本文将研究的是网络上的聚类现象,特别是现今存在的大型网络的聚类结构。主要内容有以下几章组成。第一章,我们将着重介绍网络的基本概念和发展现状,并对影响大型网络聚类结构的基本要素加以描述,同时给出本文研究的主要成果以及研究方法。第二章,主要关注的是作为随机网络基本研究手段的Laplacian矩阵上的性质。通过研究该矩阵上的特征值,我们发现具有明显聚类结构的网络,其特征值间会在特定的位置具有极大的间距,并可以用来判断块状结构的数量。同时,基于对于相应的signless Laplacian矩阵的研究,可以得到signless Laplacian谱半径,以及极限状态下,什么样的网络具有这样的半径。第三章与第四章,鉴于聚类结构没有公认的定义,而一般研究者都是采用区块内部连接多于外部连接这样笼统的说法,所以在实际寻找算法把图分类的时候,会有两个问题:一,到底区块内外差多少,才是比较合理的分类依据;二,对于某一个分类标准而言(例如Modularity),在接近其最优结果的时候,会产生很多分叉,较多分块结构完全不同的结果出现在最优结果的周围。对于第一个问题,我们在这章利用Nodal Domain理论,建立了WNDP算法,可以得到合理的块数的结果;而第二个问题,通过对于分类标准的具体研究,我们发现网络结构的局部间差异是产生分叉的主要原因。一个大型网络,不同的区域有不同的连接密度,所以通过一个全局的分类标准得到的很可能是一个不够细致的结果,因此我们加入了局部信息处理,改良原有的WNDP算法。在此基础上,我们建立了一个辅助算法,利用mixing time的概念加以扩展,定义了一个mixing rate,用以描述点在整个网络中的作用,再利用局部信息量similarity的判断,使得分块结构得以呈现,从而更好地利用WNDP算法。