论文部分内容阅读
互联网时代的到来及信息科技的高速发展,产生出各种大规模在线网络,这些网络的出现推动了复杂网络的研究。从蛋白质关系网络、科学家论文合作网络到微博关系网络、商品推荐网络等,人类对复杂网络认识逐步加深。社区结构作为复杂网络结构分析的一个重要方面,体现了复杂系统中个体间的共性与差异性。社区划分研究帮助人类更加清晰的认识和了解复杂网络的结构和演化,为网络的宏观调控和分析提供技术和方法。文中对社区发现的经典算法及其评价方法进行概述,重点对节点具有多个相关属性的社交网络进行社区划分。目前,社交网络中节点关联的属性数量和种类都在快速增加,部分社区划分越发需要依赖节点多属性的联合信息才能达到有效划分的目的,如在饮食文化、观影品味等抽象社区的划分上体现的更加明显。现有的多属性社区划分方法主要将节点的多种属性量化为节点属性向量,然后在计算节点间相似度的基础上应用传统社区划分算法。该过程中存在两点不足:一是在属性的量化上,简单的采用距离计算不能充分表达属性间的密切程度。二是各属性对划分结果的不同影响程度没有得到有效的反映。据此,文中提出对节点多属性的相似度计算应该根据单个属性的特点定义其属性相似度计算函数,并利用参数优化方法对每个属性赋予体现其重要程度的权重系数,从而改善多属性节点间的相似性度量能力。另外,结合随机游走社区划分算法,将节点间相似度视为随机游走的可能性,将多属性相似度矩阵转化为转移概率矩阵,利用随机游走算法获得节点的信息扩散矩阵进行社区划分。针对该社区划分算法中的社区合并过程慢的问题,采用多组同时合并的优化策略,对信息扩散矩阵进行处理,使信息扩散矩阵的维度迅速减小,提高社区合并速度。最后将提出的多属性社区划分技术应用于用户电影评价网络,用于发现用户间的电影品味相似性,经过实验证明,该技术可以提高抽象社区的划分效果。