半监督的社区发现方法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:WUYU8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然界中存在的很多系统可以用网络的形式表示,如人际关系网、蛋白质作用网络、交通网络等。这些网络具有很高的复杂性,因此被称为“复杂网络”。社区结构是复杂网络研究的几个重要分支之一,越来越受到人们的重视。现有的社区发现方法常存在算法复杂度高、需要事先指定社区的数目、需要预先制定评价指标等缺陷,有的甚至需要给出大致的社区大小,限制了算法的实际应用效率。LPA(Label Propagation Algorithm)是一种重要的社区发现算法,它具有思想简单、复杂度低、不需要指定社区数目等优点,但算法精确度比较低。针对LPA算法,本文设计了一种改进的基于节点局部相似性的半监督算法,本文的主要创新点有:一,LPA算法在节点的label传播过程中,由于平等的对待了节点的每一个邻居节点,当邻居节点中出现多个label数目相同时,LPA会随机的选择一个label作为候选label,此方法容易造成不同社区之间的label相互传播,从而造成社区划分的准确率比较低。本文通过计算相邻节点间的相似度,为网络的每条边加入权值,使得不同社区之间的label传播被阻断,提高了算法的精确率。二,现有的社区发现算法都属于无监督学习的范畴,无法处理事先给定的半监督知识。本文中,将LPA算法加入了对半监督知识的处理过程,通过增加must-link节点对之间的边,删除cannot-link节点对最短路径中权值较小的边,使得网络的社区结构趋于明显,从而提高了算法的精确度。三,将以上两种方法相结合,通过在不同规模的人工网络和多种真实网络中进行试验并与多种方法相比较,验证了该算法的有效性。
其他文献
本文以静态数字图像作为研究对象,以基于特征点的第二代水印算法作为核心,着重研究抗几何攻击的数字水印算法。针对Harris算子提取的特征点在图像尺度变换后重复率低,特征点分布
信息隐藏技术在计算机各个领域有着深入广泛的应用,正是由于互联网络的快速发展,保密通信、版权保护、盗版追踪等安全需求也愈发重要和紧急。不同于密码学,信息隐藏技术的目
网格计算是随着互联网的发展而兴起的一门新兴技术,它将地理分布、系统异构的各种资源,如高性能计算机、大型服务器、大型通信设备等,通过计算机互联网络连接起来形成一个无缝的
在图像真实性检测领域,基于语义进行图像真实性的检测是一个比较新的研究点,该问题涉及了图像识别、特征提取、机器学习、本体构建、推理规则等众多学科领域。本文针对基于语义
评论文本含有大量信息,是进一步数据分析的重要数据源。由于网络文本的爆炸增长和评论文本本身的信息冗余性,不能有效的利用评论文本,从中获得有用信息。评论文本的对立观点摘要
随着计算机图像渲染技术的发展,计算机生成图像与自然图像在视觉上的差别变的越来越小,计算机生成图像对真实场景的模拟越来越细致入微。研究人员在对自然图像拼接进行研究的同
微博社区识别是基于现实生活中的人发展起来的,具有依赖的真实性、联系的方向性、信息的海量性等特点。传统的社区识别技术大多是基于随机网络的研究,具有数据量比较小、时间复
近些年来,支持向量机由于其坚实的理论基础,实现了结构化的风险化最优,被作为分类工具广泛应用在机器学习的许多领域。传统的支持向量机需要解决一个二次规划的问题。这个问题的
无线Mesh网络因为具有自组织、自配置、低成本、维护简单、鲁棒性强、覆盖范围稳定等特点受到人们的关注。但其也具有无线网络中存在的一些安全问题,一方面无线链路容易受到攻
社会网络中的链接预测是数据挖掘领域的一个重要分支,也是一个社会网络分析的子任务。链接预测的研究内容包括与人们生活密切相关的网络,还包括对科学理论研究有重要意义的网络