论文部分内容阅读
社会网络分析作为一种应用性很强的社会学研究方法,成功地解决了许多社会学问题。以前的社会网络分析研究,主要集中在小规模人工收集的数据集之上。随着Internet的发展,大量社会网络数据的出现,尤其是由网络行为产生的虚拟社会网络数据的出现,为大规模的社会网络分析提供了丰富的素材,社会网络分析也越来越得到重视。这既是机遇又是挑战。面对前所未有的海量数据,社会网络分析应该如何进行?作为从海量数据中挖掘有用知识的学科,数据挖掘为回答此问题提供了条件。社会网络分析方法与数据挖掘,尤其是其中新兴的链接挖掘方法相结合,必将是解决这一问题的有效工具。
社群识别作为社会网络分析中专注于发现社会结构的一个研究方向,近年来引起了社会网络分析研究者的广泛兴趣。在虚拟社群,社会网络服务,以及犯罪网络等方面的应用使得这一课题受到越来越多的重视。而当前社群识别的主流方法都是静态方法,忽略了社会网络的动态特性,不适用于动态网络,同时也不能有效处理识别重叠社群。
为了解决上述问题,本文在对当前主流社群识别算法研究比较的基础上,从链接挖掘的角度出发,提出了一个从动态视角进行社群识别的新算法——基于元群体的动态社群识别算法(MDCM算法)。该算法从社会网络的动态本质出发,通过群体结构的变化过程识别社会网络中存在的社群。与其它主流算法不同,MDCM算法采用了对社群结构的量化定义,是自包含的社群识别算法。在对每个时间片的群体检测上,MDCM算法具有计算量小,可扩展性强的优点。实验证明,该算法不仅能有效应用于动态社会网络,并且能较好地处理社群重叠的情况。
本文有如下创新:
(1)提出一个从社会网络动态变化识别社群的算法,弥补了主流社群识别算法从静态角度分析动态社会网络,忽略网络固有的动态性的缺点。
(2)从统计角度识别社群成员,使算法可以有效处理社群重叠这一普遍存在的情况。