基于多属性的社区划分技术研究

来源 :沈阳航空航天大学 | 被引量 : 2次 | 上传用户:hexqi666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代的到来及信息科技的高速发展,产生出各种大规模在线网络,这些网络的出现推动了复杂网络的研究。从蛋白质关系网络、科学家论文合作网络到微博关系网络、商品推荐网络等,人类对复杂网络认识逐步加深。社区结构作为复杂网络结构分析的一个重要方面,体现了复杂系统中个体间的共性与差异性。社区划分研究帮助人类更加清晰的认识和了解复杂网络的结构和演化,为网络的宏观调控和分析提供技术和方法。文中对社区发现的经典算法及其评价方法进行概述,重点对节点具有多个相关属性的社交网络进行社区划分。目前,社交网络中节点关联的属性数量和种类都在快速增加,部分社区划分越发需要依赖节点多属性的联合信息才能达到有效划分的目的,如在饮食文化、观影品味等抽象社区的划分上体现的更加明显。现有的多属性社区划分方法主要将节点的多种属性量化为节点属性向量,然后在计算节点间相似度的基础上应用传统社区划分算法。该过程中存在两点不足:一是在属性的量化上,简单的采用距离计算不能充分表达属性间的密切程度。二是各属性对划分结果的不同影响程度没有得到有效的反映。据此,文中提出对节点多属性的相似度计算应该根据单个属性的特点定义其属性相似度计算函数,并利用参数优化方法对每个属性赋予体现其重要程度的权重系数,从而改善多属性节点间的相似性度量能力。另外,结合随机游走社区划分算法,将节点间相似度视为随机游走的可能性,将多属性相似度矩阵转化为转移概率矩阵,利用随机游走算法获得节点的信息扩散矩阵进行社区划分。针对该社区划分算法中的社区合并过程慢的问题,采用多组同时合并的优化策略,对信息扩散矩阵进行处理,使信息扩散矩阵的维度迅速减小,提高社区合并速度。最后将提出的多属性社区划分技术应用于用户电影评价网络,用于发现用户间的电影品味相似性,经过实验证明,该技术可以提高抽象社区的划分效果。
其他文献
生存分析是从医学、生物学、经济学等学科研究的大量实际问题中提取出来,并侧重于解决生存数据的统计推断问题的一门学科。生存分析的理论和应用研究一直以来都受到社会各界
生存分析最初起源于现代医学,工程等科学研究中的实际问题,是数理统计研究中的一个重要分支。自二十世纪七十年代中期以来,生存分析迅速发展,它着重对删失数据进行研究。生存
自从ThOms提出突变理论后,它被广泛应用于各个方面,也包括气象方面。其中气象的影响因素是多重的,即用数值形式表示气象的变幻时,为一个多维的时间序列,而现有的检测方法只能
图G的一个k-无圈边染色是满足任意两种颜色类的导出子图是森林的G的一个k-正常边染色,G的无圈边色数是使G存在无圈边染色最少的颜色数,记为a’(G).G的一个k-孪生边染色σ是指
除海洋外,陆地表面是气候系统中的另一重要下边界,对大气和气候变化也有着显著的影响。许多研究表明前期陆地下垫面状态异常尤其是地表水状态(土壤湿度及雪盖)异常与后期天气
随着网络技术的发展,到了今天,复杂网络已随处可见。而在实际的复杂网络中,最多见的就是无标度网络。无标度网络由于其自身的演化过程造成其拓扑结构有一定的特殊性。在网络
本学位论文主要对带有时滞脉冲的混杂随机微分系统的指数稳定性与脉冲镇定性展开研究,基于平均脉冲区间方法,Lyapunov函数,Razuminkhin型方法以及一些随机分析的技巧研究了带
为攻克四色猜想,Tutte在1954年提出了整数流理论.此后,整数流理论成为图论一个重要的研究分支.上世纪五十年代,Tutte证明了普通图存在处处非零的k-流当且仅当它存在处处非零
在许多实际研究中,由于一些客观条件,实验观测到的数据往往是缺失的,只知道研究对象的失效时间大于或者等于某个时间,或者在某段时间之间,这样不完整的数据在生存分析中叫做
趋磁细菌能在细胞内合成有生物膜包被的、纳米尺寸、单磁畴的磁铁矿(Fe3O4)或胶黄铁矿(Fe3S4)晶体颗粒,也叫磁小体。它是迄今发现的唯一能利用地磁场定向的原核微生物,是研究