若干社区发现算法研究

被引量 : 0次 | 上传用户：pangzhu311

【摘要】

：

随着Internet的不断发展和普及,开放网络环境下的各种电子应用平台不断涌现,为人和人之间的沟通提供了丰富多彩的电子技术手段和虚拟交互环境。在此应用背景下,社会网络分析

【作者】

：

潘磊

【发表日期】

：

2014年期

【关键词】

：

复杂网络分析社会网络分析社区发现重叠社区局部社区边社区

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet的不断发展和普及,开放网络环境下的各种电子应用平台不断涌现,为人和人之间的沟通提供了丰富多彩的电子技术手段和虚拟交互环境。在此应用背景下,社会网络分析逐步成为工业界和学术界普遍关心的热点问题,人们希望通过对虚拟社会网络进行定量的、有效的数据分析和挖掘,揭示隐含在虚拟数据背后的信息、规律和知识。社区是中观视角有效描述社会网络结构的重要指标,而社区发现也是社会网络分析中的基础性研究问题之一,在过去十多年内吸引了国内外众多研究者的关注并形成了很多研究成果。但大多数研究都是以获取全局网络的所有信息为前提的,这在实践中难以满足。本文充分利用社会网络数据的局部性特征以及幂律分布、帕累托效应等特征,从微观(节点、边)和中观(中心子团)两个层面针对社区发现问题展开算法研究。论文主要工作及创新点如下：1)充分利用社会网络中存在的普适幂律分布特性,提出了基于核心节点的局部社区发现算法LLCDA,从而回避传统算法对“必须获取全局网络信息”的条件限制。该算法使用改进的PageRank进行节点排序,然后利用网络中的局部结构信息来优化一个局部目标函数,由一个初始的种子节点,通过不断优化目标函数来获取其所在的局部社区,算法优势在于利用重要性高的节点进行社区发现,并且只需网络中的少量局部信息就可以完成社区的发现,算法效率比传统算法要高。2)针对大部分社区发现算法“社区规模不可控”及“分辨率极限限制”的问题,在上述LLCDA算法的基础上,提出了基于核心节点的多分辨率社区发现算法MRCDA,该算法通过修改的PageRank排序节点重要性并选择初始节点,同时使用基于Spin-glass模型的多分辨率模块度作为局部社区扩张的目标函数,从而扩张出规模可控的局部社区结构。算法优势在于通过参数的选择来控制不同网络应用下的不同规模的社区的发现,并且局部社区的发现效率较传统方法要更高。3)针对大部分社区发现研究的对象都集中在节点,而忽视了边在社区发现中的重要性的问题,本文将上述算法LLCDA的思想移植到边社区的发现中,提出了基于核心边的边社区发现算法LLCM,该算法使用边聚类系数进行边排序,并利用选取的核心种子边作为边社区初始成员,再利用网络中的局部信息去挖掘边社区结构,并可转化为对应的节点型的重叠社区。算法优势在对高度重叠社区的发现有较好的效果,并且算法在边社区的挖掘效果和重叠社区的覆盖上都有较好的表现。4)针对传统社区发现研究并不区分网络中节点的不同重要性及影响力,本文将网络中的节点的角色按照其重要性和影响力分为核心节点、中心成员节点和普通成员节点,基于此提出一种中心子团的定义,通过中心子团的发现找出网络中的核心区域;其次,提出一种“连接强度”的度量,用以计算网络中任意节点对直接的相似度；最后,本文借鉴了传统聚类算法的思想,提出了一种基于中心子团的社区发现算法,利用中心子团和连接强度对节点的社区归属进行分配。算法优势是在加权网络和大规模网络上的社区发现效果较好,算法时间复杂度较低,运行效率高。5)针对传统基于聚类的社区发现方法只能发现规模同等的社区,且对社区内部稠密程度不可控,本文在上述算法CCDM的基础上进行了改进,提出了两个基于密度社区发现算法DCCS和ONDCS,其中DCCS算法简单高效、易于实现,而ONDCS具有较高的稳定性和高效性,算法对于发现高密度差异性的社区具有良好的效果。

其他文献

高同型半胱氨酸对HDL-C正常患者的冠脉病变和HDL功能的影响

一研究背景随着人民生活水平的提高以及人口老龄化进展的加快,近20年来我国心脑血管疾病发病率与死亡率逐年升高。冠心病(CAD)是由冠状动脉粥样硬化引起的心肌缺血性疾病,动

学位

高同型半胱氨酸高密度脂蛋白功能对氧磷酶髓过氧化物酶如对氧磷酶1卵磷脂胆固醇酰基转移酶胆固醇酯转运蛋白脂蛋白相关磷脂酶A2

四川省天然气消费需求预测及对策研究

四川蕴藏着丰富的天然气资源,目前,在城镇化、工业化、气化全川发展进程加快的新形势下,全省天然气消费需求发生着日新月异的变化,研究分析四川省天然气消费需求情况,对全川

学位

天然气消费需求预测消费结构

受虐妇女防卫权研究

近些年发生的受虐妇女抗暴案件越来越多,各地法院在定罪方面基本保持一致,然而量刑明显失衡,3到14年不等,严重伤害了司法的权威和民众朴素的公平正义观念。基于此,论文选定受

学位

家庭虐待受虐妇女防卫权出罪受虐妇女综合症

张家口市社区居民体育锻炼现状及影响因素的分析

近年来由于张家口市交通网络的不断完善，特色种植业、养殖业、林果业的绿色崛起，崇礼滑雪、坝上草原避暑观光、逐鹿和阳原的原始文化、赤城和怀来的温泉养生等四大旅游品牌的发

学位

张家口市社区居民体育锻炼影响因素

基于辊缝动态摩擦方程的铝板冷轧机垂振机理分析

针对高速铝板轧制过程中频繁出现的冷轧机垂直振动现象,结合轧制工艺润滑原理和机械振动理论,建立基于辊缝动态摩擦方程的轧机垂直振动模型.该模型由辊缝几何形状模型,轧辊--

期刊

冷轧机摩擦振动轧制稳定性

论记者的问题意识与正确思维方式

新闻工作者应该具备正确的问题意识,正视在新闻工作——发现问题、分析问题、解决问题——过程中存在的不可忽视的＂看不到＂、＂问不出＂、＂写不对＂的突出问题。通过宏观上熟悉国家大

期刊

问题意识思维方式刻板印象

复杂空间桁架节点抗震性能试验研究及有限元分析

桁架转换层被广泛应用于高层建筑中,以实现结构形式的垂直转换,多榀桁架交界处的节点,其受力性能对整个桁架的安全性影响较大。结合工程实例,对上海市长宁来福士广场东部裙房

期刊

空间桁架节点转换层拟静力试验有限元分析抗震性能

胃肠道肿瘤术后非计划再手术27例临床分析

目的：探讨胃肠道肿瘤术后非计划再手术的原因及防治措施,降低胃肠道肿瘤术后的再手术率。方法：回顾性分析胃肠道肿瘤手术患者3 533例术后行非计划再手术27例的临床资料。结果

期刊

胃肠道肿瘤非计划再手术腹腔出血胃肠道瘘防治措施

电信运营商融合业务发展趋势和问题研究

电信运营商的融合业务是电信技术与另一种技术融合所产生的新业务或服务。技术融合是推动融合业务发展的根本因素。从技术融合角度分析,目前电信运营商已经经历了IP技术融合

期刊

融合业务电信运营商技术融合网络软化

大黄素对大鼠急性坏死型胰腺炎的干预作用

目的：观察大黄素对急性坏死型胰腺炎（ANP）大鼠全身炎症反应时血浆细胞因子白介素-1β（IL-1β）、TNF-α、IL-10表达的影响.方法：大鼠通过胰腺被膜下均匀注射3%牛磺胆酸钠制备ANP模型

期刊

大黄素急性坏死型胰腺炎IL-1βTNFαIL-10

若干社区发现算法研究

与本文相关的学术论文