论文部分内容阅读
近年来,一门新兴学科——数据挖掘,引起了人们的广泛关注,被应用到模式识别、统计学、数据库等众多领域。社会网络作为其中一个应用方向迅速发展,并且成为一个研究热点。对于社会网络的挖掘分析,传统的研究方式,是把社会网络看成一个静态图,认为社会网络是固定不变的。显然这不符合现实,具有很大的缺陷。由于动态社会网络更加关注节点位置以及节点间的连接关系随时间变化而变化的特征,符合社会网络的本质属性——动态性。它的分析对于社会网络的分析预测、社区识别、核心节点的发现等方面能够更好的体现,因此具有更大的研究价值。本文结合复杂网络的理论知识和数据挖掘的相关原理,在社会网络遵循logistic曲线原理的前提下,从个体能动性角度出发,分析在社会网络的动态演变过程中,个体的属性及个体间联系的变化。由此提出了基于节点活跃度与节点间相异性指数的两种新型的动态社会网络划分算法。基于节点活跃度的动态社会网络划分算法是针对无权网络而言的。节点活跃度描述的是节点在动态网络演变过程中所扮演角色的重要程度。在演变过程中,每个节点记录邻居节点的标签与联系次数,由此构造出每个节点的动态属性向量,进而利用相似度函数计算出不同节点间的关系,最后运用对聚类参数K值进行了小规模改进的k-means聚类方法进行划分。即对整个社会网络的演变过程进行全局考虑,由此得到每个节点的动态信息,在运用静态社会网络划分算法对其划分。而基于节点间相异性指数的动态社会网络划分算法是针对加权网络的,节点间相异性指数表示个体间交往或联系的紧密程度,相异性指数通过最短路径长度来表示。把社会网络分割成不同时间片的快照,通过Floyd算法计算出各个快照中任意两个节点之间最短路径长度的大小,求其均值,进而表示任意两个节点之间相异性指数的大小,最后通过基于相异性的算法进行划分。即采用时间分析法,基于不同时刻,对社会网络进行分割,得到一系列静态图,在把所有静态图合并在一起形成一个新的静态图,然后再对这个新的静态图内进行社区划分。上述算法是从个体的演化过程进行分析,更能体现出动态社会网络的特性——动态性。实验结果证明算法获得了很好的效果。