在线社会网络中基于属性的重叠社区发现算法研究与应用

来源 :东北大学 | 被引量 : 3次 | 上传用户:seraphim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究表明,网络已成为现实世界中许多系统的存在形式,而大多数现实网络中都普遍具有一个共同特征,即社区结构。针对在线社会网络的众多研究方向中,有一个非常有商业价值的研究领域即重叠社区发现。重叠社区不同于之前图论中提出的网络社区的概念,主要区分点是在重叠社区中,节点可以归属于不同社区。对于在线社会网络,一个节点是一个真实的人物,这些节点理所应当的具备了人所特有的多面性,即按照不同的侧面可以属于不同的社区。因而重叠社区的概念更符合在线社会网络中社区的实际特征。本文提出了两种针对在线社会网络的重叠社区发现算法,所研究的对象是如twitter、新浪微博、豆瓣网等具有关注关系的在线社会网络。两种算法分别基于社会属性网络的两种属性:一种是基于动态属性的动态属性群算法,一种是根据静态属性进行社区发现的基于兴趣的标签传播算法。动态属性群算法的大体思路是先根据关注关系将整张网络图划分为两部分,如受关注度前10%的节点为动态属性节点,其余为普通用户节点。其后根据普通用户节点的关注关系对动态属性群进行聚类。最后根据聚类结果确定普通用户节点的重叠社区划分。因为关注关系是可以由网络中的节点动态修改的,关注对象是动态的,所以这个算法是基于动态属性的。基于兴趣的标签传播算法建立在标签传播算法的基础上,主体上使用社区重叠传播算法(COPRA)的思路,通过归属系数判断标签是否被保留,从而能够发现重叠社区。与之不同的是在标签传播过程中不再使用“倒数系数”来随机判断节点是否保留标签,而是采用衰减因子与节点特征算法(HANP)中对标签传播能力的刻画,保留每个节点在传播过程中收到的有传播能力的所有标签。标签传播的对象是在线社会网络中独有的“个人标签”的概念,经过类似动态属性聚类过程减少了传播的标签总数,大大加强了标签传播算法的语义性。本文提出的两种算法不同于传统的图论算法从节点或边的角度出发,更多的是从社会学的三元闭包角度出发,因而更加符合在线社会网络的形态特征,对于在线社会网络中的重叠社区发现更加有效。本文设计了一个通过删除已有边,使用社区发现算法重建边的方式来判断重叠社区发现算法的准确性。实验表明与传统的复杂网络以或图论思想中创造的重叠社区发现算法相比,虽然在模块度这个指标上略有差距,但在发现社区的精准度上有所增强。
其他文献
计算机动画技术在计算机图形学研究领域内占有重要的地位.计算机动画的研究对象包括现实生活或虚拟世界中可以随时间而运动的物体如云雾、河流、各种动植物等,其中最有难度和
随着Web上数据爆炸式的增长,这些海量数据的背后隐藏着许多重要信息经常未被充分地挖掘和利用,Web数据挖掘技术为解决这个问题带来了希望。然而传统Web数据挖掘系统存在效率低
数据集成平台在企业管理中应用越来越广泛。本文通过分析当前主流数据集成平台产品,认为目前国内外数据集成平台还具有很多不足之处。工作流技术应用于数据集成平台能够成功
随着时代数字化的发展,指纹识别技术的应用越来越广泛,指纹采集也越来越受到人们的重视。本论文设计了基于FPGA的指纹采集卡。硬件方面,对各芯片进行了选择,并画出了系统结构
网络监测对于网络管理者来说具有十分重要的意义,但是对网络性能参数的直接测量在一些情况下是不可行的。网络透视作为一种有效的解决方法被提了出来,它根据端到端的测量结果
随着网络的快速普及和应用的日益深入,各种增值业务在网络上得到了广泛部署,网络短时间的中断就可能造成重大损失。因此,网络的高可用性HA日益成为关注的焦点。 作为网络高可
当今社会,越来越多的企业认识到,只有靠充分利用、挖掘其现有数据,才能实现企业效益最大化。大多数企业并不缺乏数据,而是受阻于数据冗余和不一致。传统的数据库应用系统是面向业务操作设计的,简化了具体操作人员的劳动强度,而企业的中高层领导却没有相应的系统。企业需要新的技术来弥补原有数据系统的不足,需要把已经广泛收集到的数据集成到数据仓库中,以便从业务数据中提取有用的信息,帮助他们在业务管理和发展上做出及时
随着Web服务数量的急剧增多,用户面临大量的服务选择。因此如何从众多功能相似的Web服务中高效地发现满足条件的服务,如何判定服务组合的正确性等问题,已成为业界研究的热点
无线传感器网络由部署在监测区域内的大量传感器节点组成。传感器节点一般依靠电池供电,其电能有限,并且传感器节点一旦配置后,由于其工作环境等因素的限制就很难对电池进行
随着Web的快速发展,丰富的Web资源构成了一个巨大的全球信息仓库。如何从Web网站中获得想要的信息成为亟待解决的问题,因此Web信息抽取成为必要,Web信息抽取技术也成为当今的一