基于嵌入向量和标签传播的社区发现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:lck2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂网络存在于现实生活的各个方面,并随着社会的进步在规模上不断增大。小到生物体内细胞间的相互作用,大到个人乃至国家之间的社会关系,都能以复杂网络的形式把个体和整体的关系表达出来,因此,复杂网络变得越来越重要。在复杂网络中,社区结构是一个非常重要的特性,可以帮助解决很多的实际问题。社区结构既能表达网络中节点行为的局部特征,也可以反映出节点之间的相互关系。研究者早在上世纪就开始了对复杂网络中社区结构的研究,涌现出了非常多的优秀成果。研究社区结构可以帮助我们理解复杂网络的结构和功能,并且对网络节点间相互作用的分析和预测起着至关重要的作用。近些年来,研究者从不同角度出发,提出了大量的社区发现算法,其中标签传播算法就是一类经典的算法。该方法思想简单、易于实现,并且具有复杂度低、执行效率高等优点,因此受到了广泛关注。但是,标签传播算法有一个明显的缺点,迭代中节点标签号的更新不稳定,导致社区划分结果差异较大。而在对复杂网络的研究中,网络表示学习是一种非常重要的技术,它通过分布式方法来描述网络,用向量的形式来表示网络中的每一个节点,这些向量之间的关系可以反映出节点之间的重要关系,得出这些相关向量的关键一环是游走策略。近年来关于游走策略的算法不断被提出,node2vec就是其中的一种,它的游走策略非常新颖,结合了宽度优先遍历以及深度优先遍历,充分探索网络的结构特性和节点的相互关系。本文将嵌入向量与标签传播算法相结合,通过node2vec算法训练得到的向量对网络中节点间的相似度进行计算,将此信息运用到标签更新规则上。此外,在node2vec方法中,通过对参数的控制,可以考虑到网络中节点之间的同质性和结构相似性,并在得到的向量中表达。本文提出的算法在几个公开标准数据集上进行实验,对比了已有的社区发现算法。实验结果表明,该算法具有较好的运行效率,对于社区的划分效果更佳。
其他文献
分析了扬州及东台11个县市14257例麻风中2114例兔眼。单侧兔眼1214例,双侧900例,共占病人总数的14.83%,占麻风眼损害的72.92%。兔眼组中下睑外翻、暴露性角膜病变及视力丧失,明
公交场站设施是公交优先发展的重要保障,为实现昆明公交优先发展战略和公交可持续发展,本文在分析昆明公交场站现状问题的基础上,借鉴国内城市的经验,提出了昆明市大型建设项
<正>在未来的两三年里,股市将进入没有大外力的内部折腾模式。人民币贬值了,它带走了一个时代——那个借助解放后人口增长红利和知识分子通过改革开放施展自己能力和价值的全
<正>2016年,腾讯公司发布的微信影响力报告指出,超过9成微信用户每天都会使用微信,6成以上用户每天打开微信超过10次,每天超过30次的重度用户占36%。另外,截至2016年2月,微信
随着社会的发展,生产力技术的提高,人们的生活水平也得到了进一步提高。在物质条件得到一定程度的满足后,人们对精神生活也提出了更高的要求。在这样一个时代背景下,与人类生活密
Ziegler-Natta类型催化剂由于具有制备成本低廉,聚合反应活性高且设备成本低等优点,在聚烯烃合成工业中已经发展成为一类非常重要的催化剂体系。而由英国BP公司研究开发出的第
随着郭庄煤矿原煤生产能力的提高,原有储装运系统无法满足现在生产能力和环保的要求,改造后的原煤储装运系统,可以同时满足选煤厂生产、汽车装车及火车装车的要求,同时消除了
投资软环境评价指标的建立需遵循一定原则。参照国内外已有研究,投资软环境的评价指标体系可分为四大类,即经济环境、社会文化环境、政策法制环境和政务环境,这些一级指标共
美国研究开发活动的分权资助体系,以及美国大学将教育与前沿研究活动相结合的特征,是美国充满巨大创新活力的主要原因。而联邦政府竞争性科研拨款机制,包括价值评议与同行评
为深入贯彻落实中共中央办公厅、国务院办公厅印发的《关于创新机制扎实推进农村扶贫开发工作的意见》和福建省、宁德市政府抓好新时期扶贫开发工作的部署要求,宁德市质监局