基于结构相似度的大规模社交网络聚类算法研究

被引量 : 0次 | 上传用户:zhang5832
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络为社交系统下个体之间的关系所组成的复杂网络结构。随着信息时代互联网科技的迅猛发展,社交网络,特别是在线社交网络,已成为人与人之间分享信息不可或缺的媒介。社交网络中个体之间的相互连接关系作为信息的传播途径,在很多方面有不可忽视的作用。如广告投递,潜在商机发现,效果预测以及危机预警。因此如何从这些庞大的网络中获取有价值的信息成为了目前重要的研究课题。网络结构分析也吸引了众多研究者的关注,其中的网络聚类即是一种有效的结构分析手段和途径。然而目前的网络聚类算法仍面临重大的挑战。首先,现有网络聚类算法没有充分考虑实际社交网络的特性。对社交网络的结构分析不同于一般网络聚类,社交网络中常常存在一些具有特殊作用的点,同时节点间的社交关系大多为有向的。其次,没有将大规模网络数据的处理作为目标。本文针对现有社交网络聚类中所面临的问题,提出了一种面向大规模有向网络的结构聚类算法。首先,提出了基于结构相似度的处理有向网络的聚类方法。本文对有向网络进行聚类操作提出了两种不同的方法:1.提出一种两阶段方法,首先将有向网络近似为无向网络,再使用结构相似度聚类算法进行结构分析;2.对现有的针对无向网络的方法进行改进使其能够直接对有向网络进行聚类。其次,针对社交网络的大规模特性,本文研究了如何将原本非并行的基于结构相似度的聚类算法进行并行化,使其能够处理大规模网络数据。算法中,针对社交网络数据特性,设计了合理的数据划分策略,各机器之间的数据交换策略。本文对算法进行了理论分析,证明采用这种高效率的并行编程框架实现的并行网络结构聚类算法的结果与原非并行算法的结果是一致的。最后,本文基于MapReduce并行架构实现了所提出的并行式网络聚类算法。大量实验结果表明本文提出的算法能够提高有向网络聚类算法的准确度,同时并行方法能够有效处理大规模的网络聚类问题。综上所述,本文在有向社交网络并行聚类问题上取得了一定的进展和效果,在社交网络的结构信息发现相关领域有很好的应用前景。
其他文献
20世纪90年代,LLS首次提出终极控股股东的概念,他们在全球范围内,以具有成熟股票市场的27个发达国家的上市公司为研究对象,通过层层追溯股权结构链考察其股权结构,发现绝大多
与常规无背索斜塔斜拉桥相比,无背索曲塔曲梁斜拉桥的主梁和主塔均为曲线,结构体系新颖复杂,塔梁构造细部处理、力学性能及长期效应行为特征独特。本文以东莞梨川大桥为研究背景
污水处理厂运行调试是污水处理工程建设的重要阶段,是检验污水处理厂前期设计、施工、安装等工程质量的重要环节。文章主要结合工程实例,研究当实际进水指标和设计指标出现很
24小时规则(R24,Rule24hours)诞生于美国遭受“911”恐怖袭击之后,作为美国政府提升国上安全防卫级别的主要海关监管规则。该规则以承运人在一国装港的装船前24小时以前,向另
本文论述了信息化对中小企业的影响。分析了中山市中小企业信息化现状,探讨了影响中山市中小企业信息化的发展的原因,最后给出了加速发展中山市中小企业信息化提升核心竞争力
本文结合某工程中压缩空气站的相关设计,针对如何优化空压站中工艺系统进行了简要的论述。
随着中国经济社会的不断发展,医疗水平和社会保障机制的不断完善,人均寿命得到不断延长,加上年轻人结婚生子意愿下降,人口出生率降低,导致老龄人口比例不断上升。与此同时,独
私人银行业务是一种专门面向高净值客户群体提供的、服务水平和等级优于一般客户群体的银行金融服务的总称。在服务过程中将各类金融产品、服务和技术整合在一起,注重高端、私
随着经济全球化和一体化程度的加深,作为传统行业的纺织企业,特别是中小型纺织企业,其生存和发展面临着越来越严峻的考验。面对传统的生产管理模式和现代经营管理方式之间的
目的探讨斯奇康联合消风散治疗肛门瘙痒症的疗效。方法选取我院收治的100例肛门瘙痒症患者,根据随机数字表法将其分为2组,对照组和试验组各50例。对照组给予斯奇康单独治疗,