基于节点间接关系的网络社区发现算法研究

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:qwezxcasdqwezxc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络是对现实系统中的主体及其关系的一种抽象表达,例如计算机形成的互联网络、人与人形成的社会网络等。由于网络在结构上继承了现实系统的复杂性属性,对网络进行研究,有助于人们理解现实系统的真实情况。在各种网络属性中,社区结构是一种能够反映网络特征的重要中观属性。如何高效地识别和划分网络中的社区结构,对分析复杂网络和预测网络发展趋势等具有重要的意义。此外,精确的社区划分还能够显著提高搜索引擎的结果相关度和推荐系统的精度,具有广泛的应用价值。  目前,研究学者们已经提出了多种复杂网络中的社区发现算法,然而划分网络社区结构还存在多种问题,如社区划分结果随机性较大、算法复杂度较高、准确率较低等。本论文针对静态网络和动态网络分别进行研究,将节点的间接关系引入到标签传播、矩阵分解和增量计算中,并提出相应的社区发现算法,以解决网络社区结构划分的随机性、精准性等问题。  论文的工作得到了国家自然科学基金课题“互联网用户偏好描述方法、形成机制与演化模式研究”(No.61271308)、“在线社交网络舆论传播演化模式及热点预测方法研究”(No.61172072),北京市自然科学基金资助项目“网络社区舆论趋势预测与观点演化机制研究”(No.4112045),和中央高校基本科研业务费专项资金研究生创新项目“在线大规模社交网络中社区发现算法研究”(No.2016YJS029)等项目的支持。  论文的主要工作和创新点如下:  1.研究了传统标签传播算法的中标签权重问题,提出了一种基于用户相似性的标签传播社区发现算法。传统的标签传播算法中节点只选取邻居用户中标签个数最多的标签,并且,认为用户标签的权重是相同的,缺乏对用户标签的个性化处理,影响了标签传播的全局性和准确性。本研究基于现实社会中用户间相似度不同的思想,引入了信息熵思想计算直接和间接邻居节点相似度,并将其作为标签传播过程中的重要因素,映射了真实的信息交互模式。研究发现在以信息熵度量影响力的情况下,标签传播算法能够有效地提高网络社区划分的精准度。  2.二分网络存在稀疏性特征,这种稀疏性对社区发现算法存在不利的影响。针对这一问题,提出了一种基于矩阵分解方法的社区发现算法。传统的矩阵分解模型使用同一目标函数对矩阵进行分解,没有考虑分解后的矩阵对应的物理意义,影响了社区发现的准确性。本论文针对分解后的两个矩阵的不同特性分别提出了相应的优化策略,使基矩阵更加趋近于正交状态,隶属度矩阵趋近于稀疏状态,以便更好地识别网络结构。并且,通过对原始网络预处理补充了节点的间接关系,此外,根据隶属度矩阵优化网络社区个数。通过数据分析结果表明,本文提出的算法能够有效划分社区结构,同时可以识别网络重叠社区及重叠节点,更有效地发现网络的潜在信息。  3.静态网络的社区结构划分往往忽略了网络的动态性,难以识别动态网络中的社区结构变化。为此,本文分析了动态网络中的变量对社区结构的影响,提出了一种基于增量的动态网络社区发现算法。该算法分别考虑了变化的节点对其所在社区的直接影响和间接影响,同时引入了间接节点间的相互关系,进一步扩展了变量节点的影响范围。实验结果表明,该算法较之传统动态网络社区发现算法具有更好的性能、更少的运行时间,相比传统的增量型算法,该算法可以得到准确度更高的社区结构。  4.针对大规模网络的数据特点,建立了一种基于用户影响力的大数据网络社区发现模型,提出了一种结合同步异步更新的并行化标签传播方式,避免了高时耗和标签振荡现象的发生。利用改进的Jaccard算法,计算直接和间接节点的影响力,更准确地表示用户信息交互的真实情况,拓宽了标签的传播范围,有助于提升标签传播的全局性。分析结果表明,本文提出的算法在平均耗时与精确度的综合分析上具有明显的优势和更高的适应性。
其他文献
近十多年来,随着互联网的快速发展和用户对数据量的需求急剧增长,光通信网络作为数据传输的骨干网络,在光器件、传输系统和接收等各个方面都有新技术的不断涌现而得到快速发
LTE作为引领未来通信发展的方向,OFDM技术凭借高频谱利用率、高数据传输率和抗多径干扰的优势,成为了LTE下行链路的关键技术,然而,OFDM技术的多载波特性也使LTE系统变得更加
火灾探测器是防火系统中的重要组成部分,伴随半导体技术及光电子工艺近年来极速发展,光电式火灾烟雾探测器已经成为市场主流产品。然而,光电式火灾烟雾探测器依然存在缺陷:探
本文对目标的可视特性进行了分析,建立了可视特性数据结构,具有对目标可视特性数据进行有效的管理及维护的应用价值,并实现一套可视化系统,为提高目标的识别精度提供了数据基
社交网络由海量的用户及用户间复杂的关系组成。不同于传统网络,社交网络中信息的传播与扩散依赖于用户间的关系。如何使信息在网络中能被尽可能多的用户所接收,即社交网络影响
有效性和可靠性这一对矛盾始终存在现代通信系统里,特别是目前使用最多的数字通信系统中。随着数字通信的飞速发展,各种高速率、突发性强的新业务不断出现,用户对于通信系统的质
通信信号的调制识别是信号分析领域的一项关键技术,在军用和民用方面均有重要应用。航空通信是无线通信中的一个重要分支,因此,对航空通信中数字调制信号进行识别研究具有重要意
随着第三代移动通信系统的不断普及,用户的应用业务也由单一的话音业务扩展到数据、多媒体等业务,同时,人们对于业务的服务质量(QoS)要求也在不断提高。相对于日益增长的移动用户
认知无线传感网络是一种新型的智能无线电通信网络。传感网络与认知无线电技术的结合解决了无线传感网络高速通信需求与无线频谱资源紧缺之间的矛盾,为无线通信领域提供了一个
本文利用近红外光谱仪采集获得近红外光谱数据,并用模式识别方法进行近红外光谱的分类研究,最终实现苹果不同品种的分类以及猪肉储藏时间的判定。由于近红外光谱本身的复杂性,例