论文部分内容阅读
社会网络上的社区发现是一个非常具有现实意义的课题,真实世界中的许多数据集都能以非常自然的方式表示为网络的形式。Web进入了2.0的时代,各种社交应用在网络上层出不穷,为在线社交网络的研究提供了大量的研究材料,分析这些数据,发现其中的规律是非常有价值的。许多研究工作已经展示出了社交网络上存在的社区结构,本文围绕社交网络上非重叠社区发现问题进行了讨论,介绍了社区发现问题的研究背景和现状,对社区发现问题的概念进行了阐述,介绍了社区发现评价方法和数据集等内容。本文对于社区发现的经典算法进行了对比,重点讨论了几个对于社区发现问题具有较大影响的算法,在真实网络和人工网络上对比了它们的划分效果和速度。在对比分析的基础上,本文提出了改进的标签传播算法——函数式衰减的标签传播算法(FALPA),避免了传统标签传播算法具有随机性及可能生成无意义的结果的问题,实验证明FALPA取得了在标签传播系列算法中最好的效果。针对微博在线社会网络的社区发现问题,本文提出了一种能够综合多种信息的微博网络社区发现算法(MICDA),通过对网络上的拓扑信息、内容信息和交互信息的合并计算,将原网络简化并重构,实验证明算法能够更好的展现出网络上的社区结构。