社会网络中基于标签传播的重叠社区挖掘研究

来源 :山东建筑大学 | 被引量 : 0次 | 上传用户:zdbzdb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会网络的兴起和流行,它在人们的生活中扮演着越来越重要的角色,对社会网络的研究也引起了人们极大的兴趣。社会网络由节点相互连接而成,而且在网络中通常会存在一些潜在的社区结构,简称社区。同一社区内部连接较为稠密,不同社区之间连接较为稀疏。通过对这些社区结构的研究不仅可以帮助我们更进一步理解节点之间存在的复杂关系,而且也有助于我们从社区的角度来理解社会网络的结构和功能。通过社区挖掘算法可以发现存在于社会网络中的潜在社区结构。近些年随着研究的进一步深入,研究者发现在真实的社会网络中社区之间往往还存在着重叠的社区结构,随之也有越来越多的研究者开始了对重叠社区挖掘算法的研究。目前在这方面也出现了一些为大家所认可的经典算法,但是大部分的重叠社区挖掘算法都会在某种程度上增加算法的时间复杂度,而当前社会网络中的数据量通常是比较庞大的,因此快速的重叠社区挖掘算法的提出就显得非常有必要。在社区挖掘算法中速度方而有明显优势的是标签传播算法,该算法接近线性的时间复杂度是其它经典算法所不具备的。标签传播算法提出后也有了很多基于该算法的改进算法,其中也包括可以进行重叠社区挖掘的COPRA算法。这些算法虽然能够快速的进行社区挖掘,但是也有各自的不足之处,比如对于COPRA算法而言,它继承了标签传播算法的一些原始的缺陷并且无法稳定的挖掘社区结构。本文将全面学习总结各种基于标签传播的算法,并分别从标签初始、标签传播、标签选择这三个方面来改善基于标签传播算法中存在的各种问题。在本文的研究中,我们首先通过提出标签预处理和半异步更新策略提升了基于标签传播思想的重叠社区挖掘算法的效率和质量,又通过在标签选择过程中引入平衡因子控制了社区挖掘结果的稳定性。最后在综合了各种标签传播算法的优劣之后,提出了可以同时关注社区挖掘的质量、效率和稳定性的BOCLP算法。
其他文献
随着互联网的快速发展,人们每天都需要从各个网络渠道获取文本信息资讯,因此对多来源的文本信息的处理就成了一项非常重要的工作。大部分传统的主题挖掘模型都是针对单一来源的文本数据而设计的,对于当前存在的各种文本数据源来说,由于文本数据的形态更加复杂,传统模型难以有效地应用于这种多源融合情况下的文本数据。不同来源的文本数据,在主题信息的分布上具有一定相似性,但在主题的词汇特征上又具有明显的差异性,但是传统
学位
遥感技术的出现,使我们能不与研究对象直接接触,通过传感设备来获取观察对象的基本信息。这就避免了一些偏远或险峻的地区信息无法取得的情况,成为至今为止全球范围内动态观测数据的唯一方式,被广泛应用到多个领域,对经济的增长和社会的发展起着很大的催化作用。然而,由于受天气、遥感设备及传输介质的影响,遥感图像在成像和传输的过程中,往往会受到很多噪声的影响,其中最为常见的噪声为高斯噪声、云噪声和雾噪声等。这些噪
WSN(Wireless Sensor Network)是继Internet之后的又一次信息革命,将改变人们的生活,促进生产力的发展,进一步加强信息世界与物质世界之间的联系。WSN由传感器、无线传输模块
硬件实验是计算机或其他专业硬件课程的必备教学环节,是培养学生实际动手能力、工程实践能力以及开发创新能力不可缺少的手段。随着电子设计自动化(EDA,ElectronicDesignAutoma
随着互联网和信息处理技术的飞速发展,电子书、电子报纸、电子邮件等电子文本已成为人们日常生活的一部分,同时文本错误也越来越多。中文文本错误分为真词错误和非词错误。其
随着无线通信技术和移动终端技术的迅速发展,移动终端得到了广泛普及。凭借其易于携带性、灵活的连网方式、人性化的交互界面和丰富的多媒体功能,使得移动终端成为人们与移动
无线网状网(WMN:Wireless Mesh Network)是一种新型的分布式网络形态,是多点到多点的相对静态的网状拓扑结构。它不是传统的节点与基础设施的一跳关系,而是通过邻居节点的多
随着互联网的不断发展和日益普及,网络上的信息量在爆炸性增长,于是搜索引擎成为人们从海量信息中获取所需信息的必要工具。但是,传统搜索引擎自身存在的不足限制了人们对信息的
近年来,云计算技术的快速发展使得信息共享变的更加频繁,而其中的安全问题如隐私数据数据泄露等也在加剧。2011年亚马逊公司数据库服务器中心运行中断事件、2012年苹果公司云
随着我国国民经济水平的不断提高和社会生产力的不断进步,家庭装修选用的陶瓷砖越来越多,人们在选择众多不同品牌及厂家的时候,对陶瓷砖的品种及质量也越来越关注。陶瓷砖作为产