论文部分内容阅读
近年来,在全球信息化大潮的推动下,社会网络得到快速发展,各种不同的社会网络都表现出一种强的社团效应。一个网路中的成员趋于形成密切联系的社团。在不同的应用下,这些社团也被称为模块,簇等。总体上,社团内部联系紧密,社团外部联系稀疏。如何快速、准确的发现网络中的社团(即社团发现)仍然是一个关键问题。从是否考虑数据的不确定性,社团发现可分为确定社团发现和不确定社团发现。很多传统确定社团发现算法都依据全局信息进行社团发现,算法效率不高,并且没有考虑到数据的不确定性。然而在现实应用中,网络中的数据往往存在其内生的不确定性,网络中数据存在残缺现象、数据以一定概率存在等,这里称为不确定网络。从不确定网络中进行社团发现的算法称为不确定社团发现算法。本文充分考虑了确定网络和不确定网络,结合社团局部特征和数据本身特点,对社团发现算法进行了深入研究。本文主要工作及创新点如下:(1)对LFM(Largest Fitness Measure)算法进行改进。深入分析了局部社团发现算法LFM算法以及势能模型,在此基础上提出了LFM算法的改进算法—WLFM算法。该算法利用势能的思想对LFM算法中随机选取初始节点、划分准确性较低、算法结束条件难以达到等问题进行改进,最后通过两组实验验证了该算法具有良好的准确性和较高的效率。(2)对EM(Expectation Maximization)算法进行改进。首先对高斯混合模型的EM算法进行详细介绍,接着对此算法进行优化。利用势能的方法对高斯混合模型的EM算法进行初始化,得到优化的初始值。通过两组实验证明新的算法具有较低的错误率。(3)提出不确定相对K紧密子图发现算法。研究发现,寻找前K个最紧密子图具有较高的复杂性。本文研究了从不确定图中发现存在概率较高的前K个紧密子图问题,提出了不确定相对K紧密子图发现算法。在算法中,由不确定图的连通指数确定阈值,接着根据阈值计算子图的存在概率,最终得到存在概率较高的前K个紧密子图。最后,通过若干组实验,验证了此算法可以高效、准确的发现不确定图中的紧密子图。