基于图挖掘的网络社团结构发现

来源 :复旦大学 | 被引量 : 4次 | 上传用户:liupingxiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界的网络里自然地包含了很多社团结构,它们已经成为网络系统中一个重要的统计特征。例如,在社会网络中,它们可能代表着一组俱乐部成员;生物网络里,或许是一组功能相关的基因组;在语意网络中,它们是一些与某个主题相关的网页。通常来讲,社团结构是一些联系紧密的实体,结构内部节点之间的联系相对网络中其它节点更紧密。如何高效地挖掘出这些结构对理解和分析网络结构来说是一个很重要的问题。尽管在网络社团的发现方面已经取得不少研究成果,但仍然存在许多问题有待解决。比如,有些算法的效率不是很高,社团结构的度量机制不够完善;很少有工作去关注重叠的社团结构,虽然重叠的结构在现实的网络中更普遍存在,也更能反映出真实世界的本质。针对这些问题,本文借助一些经典的算法来产生社团结构的种子,然后以拓展种子的方式来挖掘网络中重叠和非重叠的社团结构。本文的主要贡献如下:1.结合多层次策略,文中运用经典的图谱划分方法产生了种子集合,并对种子的特征进行了分析。多层次策略使得算法在计算最粗糙图的Fiedler向量时具有很好的划分速度;谱平分方法帮助算法过程找到很好的图划分线索。这些种子集合抓住了社团结构的主体,反映出了目标社团的特征,具有很好的性能。在真实的网络数据上,文中也对种子选取的合理性做出了验证。2.运用种子拓展的方式提出了一种新颖的社团识别算法。该算法基于模块函数和节点的传递概率。模块函数是由Newman和Cirvan来定义的,它已经成为度量社团结构的一种主流标准。算法用它的改变值来评估新扩展节点对当前种子集合的贡献。传递概率在算法中被用来推断相邻节点之间的联系,反映扩展到新节点的权重。传递概率的源头是种子集合中节点的初始概率(初始权重)。新节点得到的概率决定了计算节点贡献值的次序,贡献值又决定了节点是否具有进一步扩展的机会。第4章对算法过程做出了详细的描述,同时也对扩展过程中节点的删除操作和扩展步上逃逸的概率做出了分析。3.对网络中普遍存在的而又很少被关注的重叠社团结构,文中提出一种识别算法。对解决重叠问题,它开辟了一条新的途径。该算法仍然基于种子扩展。在得到种子集合之后,算法结合随机行走技术给出了一种合理的扩展过程,它用时间步来刻化。在扩展的每个时间步,算法首先计算出所有标准化后的节点概率。按照概率值的降序,所有的节点依次被扫描。然后,确定哪些节点在接下来的时间步里作进一步的扩展。通过节点扫描,算法还要对新扩展的节点作出是否为当前的种子集合贡献者的判断。这些判断主要用于寻找候选社团在当前时间步最优的结构。运用贡献节点的性质,文中给出了一些定理。基于性质定理,一些无用的扩展节点在寻找候选社团的最优结构时可以被安全地删除。扩展过程执行上述步骤直到社团结构之间的重叠率超过了用户的忍受范围或者到达了随机扩展的收敛时间。第5章不仅介绍了算法步骤,也对扩展过程给出了理论分析。分析表明,提出的方法使得候选社团在每个时间步上都能找到最优的结构,基于懒惰随机行走的整个扩展过程也能给种子集合带来好的扩展结构。4.在六个网络数据集上,对上述提出的算法作出了验证。数据集来自真实的网络,规模大小不等,内容涉及多个领域。在实验分析上,文中从多个角度运用多种机制来评估算法。评估内容包括种子选取方式上的对比,算法与相关工作的比较以及时间分析等。对重叠的社团结构,还给出了在著名的网络里发现的实例。实验结果表明文中提出的方法具有一定的优越性,同时也证明了重叠方式对识别完善的社团结构是非常重要的,让大家认识到重叠社团在真实网络中的研究意义。综上所述,本文针对网络中的社团发现问题提出了几种新算法。这些算法采用了种子扩展的方式,扩展过程基于随机行走技术,扩展结构选用了模块函数来度量。文中用理论分析和大量的实验验证了这些算法。结果表明提出的方法能识别出结构完善的社团结构,具有很好的性能。
其他文献
我公司新近安装的1台OMEGAlap E36型条并卷联合机,作为精梳准备设备,其采用独特的皮带卷绕技术,实际成卷速度可达230m/min,该设备在棉卷腔内安装有两个吸风管,用于清洁卷绕带
平衡计分卡是企业绩效管理的工具。它将企业战略目标逐层分解转化为各种具体的相互平衡的绩效考核指标体系,并对这些指标的实现状况进行不同时段的考核,从而为企业战略目标的
时间:2016年2月21日——2016年2月27日行程:第一天抵达大阪,入住酒店欢迎晚宴+演讲第二天大阪企业家博物馆日本工商发源地,访问大阪企业家博物馆,了解从19世纪以来活跃在大阪
针对高贝利特硫铝酸盐水泥水化迅速、凝结时间短的问题,探讨了不同掺量的柠檬酸钠、硼酸和氨基三亚甲基膦酸在不同温度下,对高贝利特硫铝酸盐水泥凝结时间和水化热的影响。研
简要叙述了中国耐火材料工业50年来的发展。它经历了三个时期:经济恢复时期(1949~1952年);初期发展时期(1953~1966年)以及改革开放时期(1980~1998年)。还讨论了即将来临的新世纪耐火材料的发展前景
20世纪90年代以来,国际运输业正经历着由彼此割裂的运输方式向不断整合集约的运输方式发展,全新一代的港航发展模式正在酝酿中。港航合作战略,即指港口企业和航运企业之间,通
本次为解决城镇化进程中工业与民用建筑施工中的防渗漏问题,通过对工业与民用建筑物施工准备要求、分析建筑物各部位渗漏的原因,归纳与推导出建筑物防渗漏的应用技术。结果显
先前的研究发现,在重复博弈情境中,相比于外群体成员,个体更愿意付出代价使内群体成员受益,表现出合作行为的内群体偏爱。社会认同理论和有界广义互惠理论分别从自我概念和声
为增强智能锁的安全性,提高开锁效率,提出采用手机进行智能门锁控制的方法,设计了一款基于手机和WiFi的智能门锁。以STC12C5A60S2单片机为核心,结合WiFi通讯,实现手机控制门
船舶靠泊作为船舶航行中最重要的一环,船长须具有丰富的经验才可以驾驶船舶完成船舶的靠泊任务,由于智能船舶的提出与发展,船舶的自动靠泊也成为船舶航行领域亟待解决的问题