基于节点属性变化的动态社会网络划分研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:wqg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,一门新兴学科——数据挖掘,引起了人们的广泛关注,被应用到模式识别、统计学、数据库等众多领域。社会网络作为其中一个应用方向迅速发展,并且成为一个研究热点。对于社会网络的挖掘分析,传统的研究方式,是把社会网络看成一个静态图,认为社会网络是固定不变的。显然这不符合现实,具有很大的缺陷。由于动态社会网络更加关注节点位置以及节点间的连接关系随时间变化而变化的特征,符合社会网络的本质属性——动态性。它的分析对于社会网络的分析预测、社区识别、核心节点的发现等方面能够更好的体现,因此具有更大的研究价值。本文结合复杂网络的理论知识和数据挖掘的相关原理,在社会网络遵循logistic曲线原理的前提下,从个体能动性角度出发,分析在社会网络的动态演变过程中,个体的属性及个体间联系的变化。由此提出了基于节点活跃度与节点间相异性指数的两种新型的动态社会网络划分算法。基于节点活跃度的动态社会网络划分算法是针对无权网络而言的。节点活跃度描述的是节点在动态网络演变过程中所扮演角色的重要程度。在演变过程中,每个节点记录邻居节点的标签与联系次数,由此构造出每个节点的动态属性向量,进而利用相似度函数计算出不同节点间的关系,最后运用对聚类参数K值进行了小规模改进的k-means聚类方法进行划分。即对整个社会网络的演变过程进行全局考虑,由此得到每个节点的动态信息,在运用静态社会网络划分算法对其划分。而基于节点间相异性指数的动态社会网络划分算法是针对加权网络的,节点间相异性指数表示个体间交往或联系的紧密程度,相异性指数通过最短路径长度来表示。把社会网络分割成不同时间片的快照,通过Floyd算法计算出各个快照中任意两个节点之间最短路径长度的大小,求其均值,进而表示任意两个节点之间相异性指数的大小,最后通过基于相异性的算法进行划分。即采用时间分析法,基于不同时刻,对社会网络进行分割,得到一系列静态图,在把所有静态图合并在一起形成一个新的静态图,然后再对这个新的静态图内进行社区划分。上述算法是从个体的演化过程进行分析,更能体现出动态社会网络的特性——动态性。实验结果证明算法获得了很好的效果。
其他文献
近年来,随着互联网的进一步普及,电子商务一直保持着高速的增长状态,它不仅改变了人们的生活方式,还有力的推动经济的全球化进程。随着人们生活节奏加快以及对数据的实时性要求越
随着计算机技术的蓬勃发展及网络的日益普及,数据收集和存储技术快速发展带来的海量复杂数据,不仅导致了“数据危机”,还带来了“维数灾难”。随之而来的,在大数据时代为了消除噪
随着信息技术的不断发展和Web2.0的到来,人们习惯于通过雅虎、搜狐、新浪等在线新闻网站获取最新的新闻资讯并发表自己的观点和态度,任何国内外新闻事件都有可能引发网民产生巨
随着互联网技术的不断普及,使得网络在社会发展过程中逐渐成为不可或缺的关键角色,网络安全在这种趋势下受到了越来越多的关注,各类基于安全防御的手段层出不穷,在一定程度上防止
随着在线社会网络的蓬勃发展,人类交互和共享信息的方式发生了巨大变化。开放便利的互联网为人们的交流提供了更加宽广的平台,但同时也为谣言扩散孕育了理想的媒介。因此对谣言
虚拟化技术自二十世纪六十年代出现以来,发展迅速,尤其在目前云计算成为研究热点之后,虚拟化技术的研究更成为热点中的热点。虚拟化技术在出现之初,主要是为了能够将大型主机进行
移动互联网和高性能终端设备的快速发展,尤其是GPS定位应用的不断完善和普及,给人们的日常生活带来极大的便捷,基于位置的服务(Location Based Service,LBS)在生活中成为我们不可或
近年来,互联网在世界范围内蓬勃发展,其承载的信息量更是急剧膨胀。互联网承载的数据一部分是可以从Web页面上直接获取的表层数据,另一部分是以结构化方式存储于数据库中的Deep
计算机辅助几何设计中,曲线、曲面有两种基本的表示方法:参数形式和隐式形式。在实际应用中这两种表示方法有着各自的优缺点。参数曲线曲面具有构造简单直观、易于显示等特点,又
当今世界计算机和互联网技术的不断发展和带宽的快速增加,P2P的文件共享占据了网络绝大部分流量,成为互联网文件分发的主要模式之一。P2P文件共享就是P2P技术技术发展的动力源