社交网络的非重叠社团划分算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:hpp6855132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,社交网络变得日益庞大和复杂。社交网络是指人与人之间关系而组成的复杂网络。复杂的社交网络存在着一个共同的特性——社团结构,即社团内部的节点联系紧凑,而社团之间的节点联系稀疏。在整个网络中,我们根据节点之间关联关系,寻找联系紧密小型子网络结构的过程称为社团划分或社区发现。网络中的类型社团根据所有节点是否所属于多个社团情况分为非重叠社团和重叠社团。社交网络的社团划分可以应用于多个场景:在同一个社团中推荐好友、对同一个社团中用户进行商品推荐等。由于社交网络具有复杂网络的一般特性,人们常常使用复杂网络对社交网络建立模型进行研究。获得复杂的社交网络中高效而又准确的社团划分,这是研究复杂网络中社团划分问题的出发点和落脚点。在此研究领域中,众多学者提出许多经典的算法:GN算法、谱平分算法、随机游走算法、标签传播算法、CPM算法和EAGLE算法等。然而,近年来,社交网络呈指数式发展,许多经典的算法面临了更多的挑战。本论文着力于无向网络的非重叠社团划分的研究问题,根据不同的社交网络特性提出了三种社团划分算法。(1)面对规模较小已知社团个数网络时,本论文针对非重叠社团划分问题,提出了ECFM算法(Easy Community Finding based on Matrix Algorithm)。该算法划分后的准确率较高,但是该算法存在着不足:需要指定网络中的社团个数,否则无法判断算法终止条件。(2)针对ECFM算法的缺陷,本论文利用遗传算法和聚类算法的思想,提出了GKNM算法(Genetic K-Means based on Normal Matrix Algorithm)。该算法较以前的经典算法在划分准确率上得到明显地提升。该算法由于采用了遗传算法的架构,该算法的运行时间耗费较长。同时,该算法选取了Normal矩阵作为聚类模型,不适用于规模较大的网络。(3)针对复杂的网络模型,本论文利用了LPA算法具有超低时间复杂度的特性,采用了多重标签传播模型,提出了CMLPA算法(Multiple Label Propagation based on Clique Algorithm)。该算法不仅在时间复杂度上与LPA算法一样近乎线性,而且在结果准确率上高于其它一些算法。在设计算法时,CMLPA算法遵循了Pregel计算框架,该算法是可以运行在Spark大数据框架下。
其他文献
学位
为了研究随机变量的相依性,本文第一章介绍了 Copula函数的研究背景,第二章引入了适用于宏观经济领域的时间序列模型AR-GARCH函数,并分析了它的优点。第三章,介绍了 Copula函
1970年,A.D.Aleksandrov提出:若f为定义在两个距离空间中的保持某一个距离的映射,那么f是否为一个等距映射?这就是所谓的A1eksandrov问题.Aleksan-drov问题被许多数学工作者广
泡桐(Paulownia)为泡桐科(Paulowniaceae)泡桐属(Paulownia Sieb.)的落叶乔木,是我国重要的速生用材、农田防护林和园林绿化树种,在木材供给、保障粮食安全、改善生态环境等方面具有重要价值。干旱是泡桐整个生命周期所遭受的主要威胁,严重影响泡桐的生长发育。植物的次生代谢指合成非生命活动所必需的次生代谢产物的过程,其代谢产物是植物长期不断适应环境,并进化的结果,它们可以
本文考虑如下的薛定谔方程初值问题的数值解,其中,h表示普朗克常量,m为粒子的质量,φ(x,t)为波函数,i=(?)为虚数单位。初始函数φ0(x)和源项f(x,t)具有紧致性。区域的无界性
客户关系管理是指企业为了提高核心竞争力,利用相应的信息技术以及互联网技术协调企业和客户在销售、营销和服务上的交互,从而提升企业的管理模式,向客户提供创新式的个性化的客户交互和服务的过程。全球经济一体化趋势越加明朗,企业同时要面临来自外资品牌和本土品牌日益强大的双重竞争压力,客户关系管理可以发挥和加强企业核心竞争力,在此基础上帮助企业吸引新的客户、保留老客户以及将现有客户转为忠实客户,使企业改变以生
非线性算子不动点问题是非线性学科的一个重要分支。不动点理论是处理非线性问题的最重要的思想与工具,在解决凸优化问题、分裂可行问题和均衡问题中起到了关键的作用。本文
互联网经济的不断发展,激发了众多的新型网络不正当竞争纠纷。新型网络竞争纠纷所具有的的频发性、复杂性及严重性等特点使得立法界和司法界必须要对此种不正当竞争类型予以高度重视。于2018年1月1日正式施行的新《反不正当竞争法》寄希望通过增添第12条即“互联网条款”的方式来实现更好地规制新型网络不正当竞争纠纷的目标。但由于互联网条款的内容有较大缺陷使其无法很好地规制新型网络不正当竞争纠纷,因此那些无法被第
追溯函数逼近论的源头,始于1885年德国数学家Weierstrass所建立的关于连续函数可以用多项式逼近的著名定理和1859年前苏联数学家Chebyshev提出的最佳逼近的特征定理,这两个定
目的:通过观察以子续葛根汤治疗的脾肾两虚型先兆流产患者的临床疗效,以及本方对患者的血清同型半胱氨酸(Homocysteine,Hcy)、β-人绒毛膜促性腺激素(Human Chorionic Gonadotropin,β-h CG)、孕酮(Progesterone,P)、雌二醇(Estradiol,E_2)相关检测指标的影响,为今后先兆流产的临床治疗拓展诊治思路、提供研究方向。方法:将符合脾肾两虚