基于相似度投票和信息传递的静态与动态社区划分算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:yulu0355
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实生活中存在着各式各样的社会网络,如路由自治网络,科学家合作网,Twitter用户关系网等。对于社会网络的研究早在1969年之前就已经开始,研究发现社会网络具有小世界性质,度的幂分布性,社区结构等内在特性。由于社会网络巨大的实用价值,这一领域吸引了生物学家,社会学家,计算机科学工作者等的深入研究。社区结构因其巨大的实用价值如恐怖分子追踪,个性化推荐,舆论控制等,成为了研究者关注的重点。随着研究者的不断探索与创新,一系列社区划分方法被提出,在社区结构方面取得了一定的成就。然而,随着科学与技术的发展,社会网络的规模迅速扩大,如一些社交类社会网络其用户数大多都是数以亿计的,这使得目前的大多数社区划分算法难以胜任。较高的时间开销是许多算法无法在大规模社会网络上进行社区划分的主要原因,针对这种情况,本文提出基于相似度投票的社区划分算法Community Division Algorithm Base on Similarity Voting(CDBSV算法)来满足这一迫切需求。CDBSV算法利用邻居节点间的局部相似度结合投票机制快速完成社区的初步划分,使得大规模社会网络的规模得以快速缩减,然后在较小规模的社会网络上利用模块度增量准则迭代地进行社区划分,直到获得具有最大模块度的社区划分。因为CDBSV算法使用计算简单的局部相似度并结合投票的机制,所以算法第一阶段在保证模块度的同时能够实现网络的快速缩减。在减小网络规模后,就可以使用准确度较高,但计算略显复杂的模块度增量准则来进行进一步的划分以获得最大的模块度,从而完成大规模社会网络的社区划分。在探究社会网络的社区结构的过程中,研究者注意到随着时间的缓慢推移,社会网络是在不断变化的。节点间的关系不是一成不变的,社会网络会有节点的新增和消失。虽然,社会网络在缓慢变化,但是其社区结构往往在较短时间内却是稳定不变的,或者变动不大。因此,通过详细研究社区结构与节点的关系,以及节点变动对社区结构的影响,本文提出了一种增量式的动态划分算法来完成社会网络的快速划分。基于信息传递的动态划分算法Dynamic Partitioning Algorithm Base on Information Transmission(DPBIT算法)利用网络增量对社区划分进行修正来完成新社区的划分。通过分析节点变动对邻接社区模块度的影响,来确定其邻居节点可能被划分到的社区,从而将节点变动的信息传递给其邻居节点,而不是直接测试邻居节点所有可能的社区,以此加速算法。最后,在真实的社会网络上验证了CDBSV算法与DPBIT算法的有效性,实验结果表明CDBSV算法适用于大规模的社会网络的社区划分任务,算法准确率较高,且时间效率要高于现有算法;而DPBIT算法相对其他动态算法可以更为高效地完成动态社会网络的社区划分且模块度较高,在时间效率上也远胜于传统静态社区划分算法。
其他文献
在对实际系统建模的过程中,常存在多种不确定性,比如模型误差,测量误差等,通常将其称为未建模动态.它的存在严重影响着系统的动态性能,甚至会破坏系统稳定性.消除或抑制未建
近年来,由于控制科学、计算机科学、通信工程等领域交汇融合的发展,多智能体系统协调跟踪控制研究引起了学术界和工程界的不断关注,随着研究的不断深入,有关多智能体系统协调
在水污染日益严重的背景下,为实现科学准确地治理已污染水体以及保护未污染的水资源,必须进行有效的水质检测工作,从而全面掌握水污染状况,为水资源保护提供依据和指导。目前,用于指示水体有机污染程度的常规检测指标主要包括化学需氧量(COD)和生化需氧量(BOD)。本文在前人的研究基础之上探讨了一种COD和BOD的一体化测定技术。通过活性污泥曝气降解有机物污染物的方式考察了BOD测定过程,采用控制变量的单因
随着云计算技术的兴起,云平台上的计算资源和存储资源应用的越来越普及,基于这种新型系统架构,云计算提高了应用系统的可扩展性和高可用性;其业务模型能够满足企业降低成本、
在传统的数据分类中,通常需要挖掘区分能力较高的频繁序列作为分类依据,从而为用户提供潜在的高价值信息。近年来,随着不确定数据处理需求的快速增长,挖掘不确定数据集上的区
清末新式学生群体是由传统走向现代的第一批学生群体,也是五四新学生乃至当代学生的雏形。近代对中国影响较深的人才,究其源头,大都是由清末新式学生成长起来的。本文以湖南新式学生为切入点,从近代区域学生史、教育史的角度,对清末湖南新式学生群体的产生背景、发展概况、与社会变革的关系,进行了较为全面的论述。清末湖南新式学生群体是在民族危机加深、民族资本主义初步发展、新式教育改革的背景下诞生的,他们主要是一批接
随着互联网技术的逐渐普及,人们的社交方式也从传统模式逐步发展到线上平台交流,夜以继日的新用户增加使得各类线上社交平台产生出越来越多的社会网络数据。社会网络数据除了
随着众包模式作为一种新型的经济模式,国内外不同类型的众包平台也如同雨后春笋般的涌现。基于NoSQL数据库的轻量级众包平台是目前使用的最为广泛的众包模式,其高效的读写性
铁基非晶合金具有优异的软磁性能,在共模电感、变压器、互感器等领域已经取得广泛应用,在特高压、核工业等极端服役环境下也有广阔的应用前景。开展强电场和辐照等强外场环境下非晶合金组织演变和性能变化,对非晶合金的成分开发和应用具有重要的意义。然而,目前关于强外场作用对非晶合金影响的研究较少。基于此,本文以铁基非晶薄带材料为研究对象,采用强电场处理和辐照处理,研究分析外场处理前后的组织性能,阐明外场作用下物
Why-not问题,致力于对查询结果中的缺失数据作出解释,近年来在数据库社区受到很大的关注。对why-not问题的合理解释,能够提高数据库的可用性,在实际生活中有很多重要应用。移