基于SCAN算法的社区发现算法研究

来源 :南京信息工程大学 | 被引量 : 2次 | 上传用户:chufs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社区发现是复杂网络研究领域的一个重要的研究方向。一个网络由若干社区组成,每个社区在内部节点之间联系相对紧密,在外部社区之间的联系相对稀疏。SCAN算法是近年来涌现出来的社区发现算法中比较优秀的算法,它是一种基于结构聚类的算法,这也是它名字的由来(Structural Clustering Algorithm for Networks)。它的优秀表现在线性的时间复杂度,精准的划分结果,并且可以识别社区结构之外的信息(枢纽节点和孤立节点)。虽然SCAN算法有很多的优势,但是缺陷也是很明显的。SCAN不能识别重叠社区,而社区的重叠现象是广泛存在于网络中的;由于在线社交网络的发展,网络结构的演进变化大大快于从前,能够动态地分析网络得出社区结构应该是研究的大趋势,而SCAN算法缺乏这方面的能力。另外,SCAN算法需要人工设置两个参数并且算法的精确度严重依赖参数的选择。结合以上内容,本文在SCAN算法的基础上改进扩展出两个算法,具体研究成果如下:(1) SCAN算法优化改进SCAN算法包含两个参数:ε和μ,我们主要对参数进行优化,一是参数的约减,二是降低算法对于参数的敏感度。首先,我们只保留了参数£用于限定核心网络,并且采用一个循环删边的操作降低算法对于这个参数的依赖,使得阈值α在很大的选择范围内算法都能得到令人满意的社区划分结果。(2) SCAN算法功能扩展本文对SCAN算法进行重叠节点识别的扩展,提出了LED算法。循环删边过程促使社区分裂,在分裂的时候被删除的边的两个节点就是社区边缘的节点,是我们重叠节点检查的对象。我们采用社区平均度作为重叠节点的识别标准,在删除的边的节点中识别重叠节点。在LED算法的基础上扩充对于动态网络的处理能力,算法分为线上线下两个部分。线上部分保存网络数据和部分中间计算结果,并且根据网络的变化,分析出最大影响区域,在影响区域内局部更新网络数据和中间计算结果,从而最大限度的降低重复计算。线下部分负责从线上部分维护的数据中抽取社区结构,识别重叠节点。
其他文献
高中教育在整个教育体系中居于重要地位,其发展状况如何不仅关系到一个国家、民族和每一个人的发展,而且还关涉到教育公平与正义等众多社会问题的解决。正因如此,近年来世界
2008年底的全球金融海啸来势之猛、之急,使得中国经济暂时性陷入发展低谷,很多企业更是受到严厉冲击、经营受阻。金融危机之后,国家凭借实施积极的财政政策、宽松的货币政策
随着科学技术的迅猛发展,信息化和经济全球化的快速到来,基础教育课程都在世界各国发生着深刻的变化.变革趋势的目标指向培养身心健康发展的对社会有用的人。自20世纪90年代
为适应高等学校信息化建设的需要,合理利用教育资源,实现信息共享,依据研究生教育管理工作流程,采用成熟、先进的Web技术和数据库技术,开发了基于组织资源和效能的新疆财经大
随着竞技体育的发展,篮球运动的水平飞速发展,我国篮球运动改革不断深化,我国的篮球竞技水平也在不断提高,同时也培养出了像姚明、王治郅、易建联等NBA国际篮球明星,篮球运动
消费是指人们在物质资料和劳务的生产与生活中,对物质产品和劳动力的消耗过程,是人们为满足物质和文化需要而进行的活动。大学生消费是指高等院校学生在学习生活过程中,为了
山东莱芜钢铁集团有限公司棒材厂设计应用了适用于水平轧机与立式轧机的可调组合式滑动进口导卫装置。这种结构形式的导卫,其内腔尺寸可调、安装尺寸可调,可同时满足孔型轧制及
民居建筑是在特定文化空间与特定地理环境内产生的独特文化现象。是民族智慧与审美的结晶。民居建筑的规模、结构、装饰的形成演变,是其民族文化发展历程的缩影。建筑与民族
长期以来,我国大学英语教学一直沿用以教师为中心的传统的课堂教学模式,在这种模式下,学生是知识的被动接收者,而不是积极构建者,他们在课堂上学到的知识难以灵活运用到实际
轮式装载机是用于装运散料、块料为主的工程机械设备,广泛应用于公路、铁路、建筑、港口和矿山等工程建设。轮式装载机工作装置是装载机上实现装料、运料和卸料的空间多杆机