基于层次聚类的社区发现算法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:neoin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实社会中存在着各种具有特定功能的系统,例如电子商务系统、科学著作系统、在线社交系统等,这些系统可被抽象为具有复杂内部结构的网络,称为复杂网络。很多研究表明,复杂网络具有一个非常重要的特性——社区结构。社区结构可理解为网络中相似元素的集合,挖掘社区结构有利于理解复杂网络的结构与功能。社区结构往往具有层次性,例如地域关系网络中,如果以居民聚集地为标准划分社区,那么这些社区是由小到大层层嵌套的,因为村包含于镇,镇包含于县,县包含于市等等。为了挖掘复杂网络社区结构的层次性,本文从层次聚类的角度研究复杂网络中的社区发现问题,主要包括以下内容:(1)提出一种基于节点相似度的层次化社区发现算法。传统Louvain算法虽然速度极快,但其模块度函数只考虑节点间的链接信息,而忽略周围邻居节点的影响,导致同一社区节点之间的紧密程度下降,从而影响最终社区划分结果的准确性。针对此问题,本文引进节点相似度并加以适当改进,然后重新定义模块度函数,提出基于节点相似度的层次化社区发现算法。在真实网络和LFR人工网络上的实验表明,该算法明显提高了层次化社区发现的准确性。(2)提出一种基于最大团的层次化重叠社区发现算法。研究表明,很多真实网络具有重叠结构,为了能够同时发现层次结构和重叠结构,将传统层次聚类算法的扩展对象由节点换为最大团,并定义最大团扩展的策略,提出一种基于最大团的层次化重叠社区发现算法。该算法利用最大团扩展策略生成层次结构树状图,然后采用重叠模块度函数选择最优结果。在真实网络和LFR人工网络上的实验表明,该算法能很好地实现层次化社区发现,并能准确地识别出重叠节点。
其他文献
词是语言中最小的能独立运用的单位,是自然语言处理的基本单位。词法分析是自然语言处理的一个基础课题,其主要研究内容是进行词语切分和词语标注。语言学上,按照词的形态结
图像分割作为图像智能化处理的重要发展方向,受到图像处理界的高度关注。遥感图像分割作为图像分割中一个重要应用,深受研究者的重视。由于遥感图像与其他类型图像相比,具有
随着信息技术的快速发展,大量的软件产品已渗透到各行各业。如何保证软件的质量问题成为一个关注焦点。软件测试是确保软件产品质量及可靠性的主要途径,其地位是无可替代的。
随着海洋技术的发展,水下通信网络,作为通信网络的一个重要分支,在海洋监测、水下定位、海洋资源勘探等方面发挥了重要的作用。但是,水下通信网络的研究也有一定的困难,有很
人工智能是计算机科学的一个分支,目的是使机器能够像人类智能一样感知环境并最大化达到目标的可能。机器博弈是人工智能极具挑战的分支之一,其研究对人工智能的发展具有积极
人脸识别技术作为最具有发展潜力的生物特征识别技术之一,在最近几年得到了广泛的研究和应用,尤其是基于视频的人脸识别技术。本文重点研究基于视频的近距离人脸识别方法,主
随着电子商务的迅猛发展,用户购买和使用产品之后会在Web上发表对产品的评论,产品评论的自动挖掘对于商家和潜在的消费者有着重要意义。本文以中文产品评论为主要研究对象,从
项目调度问题是一类具有顺序约束和资源约束的组合优化问题,是典型的NP难问题。机器调度是特殊的项目调度问题。   本论文以最小化完工时间为优化目标,研究两类典型的机器
离群点检测作为知识发现的重要部分,被广泛的应用于欺诈识别、入侵检测、故障诊断及恶劣天气预报等领域。近年来,随着人们对离群数据挖掘重要性认识的不断加深,以及其越来越
多视角视频拼接被广泛应用于视频监控、视频会议、卫星遥感等领域,它可以在保证高分辨率的情况下扩大视频视角,一直是计算机视觉领域的研究热点。多视角视频拼接的关键是视频