基于PowerGraph并行计算框架的社会网络分析研究

来源 :河北师范大学 | 被引量 : 1次 | 上传用户:shijiatiedaoxueyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是一种基本的数据结构,能够体现出不同实体之间的关系。在不同的应用领域中,图被广泛用来表示十分复杂的数据,比如:社会网络、蛋白质网络、运输网络、书目网络以及更多其他网络。如今,个人、社区、组织、国家等行动者之间的关系越来越紧密,这些关系中所蕴含的有价值的信息也随之飞速增长,使得社会网络分析的研究日趋火热。一般而言,社会网络分析是一种重要的大数据发现技术。当前,拥有百万、甚至亿万节点和边的大规模社会网络已十分普遍,为了处理和分析大规模网络出现了一些符合其计算特点的分布式图并行计算平台。然而,由于许多社会网络分析的经典算法都是基于单机设计的集中式算法,无法满足大规模社会网络分析的需求。因此,本文着重从社会网络传播、矩阵分解、网络重构这三方面入手,在PowerGraph图并行计算框架下设计并实现并行图数据分析算法。本文主要完成了以下几个方面的工作:1)基于PowerGraph的并行传播算法病毒的蔓延、信息的扩散等,都可以看成是服从某种规律的网络传播行为。通过传播模型,可以模仿这些传播行为,有助于人们理解传播机制。传播模型有很多种,对不同的病毒或信息,适用的传播模型也不相同,经典的传播模型有SIS、SIR、SIRS、SEIR。本文基于PowerGraph提出面向SEIR模型的并行传播算法PSA-SEIR(Parallel Spreading Algorithm for SEIR Model)。经实验验证,仿真结果与SEIR模型的传播趋势相符,同时分析了算法的可扩展性。2)基于PowerGraph的并行矩阵分解(SVD++)算法在社会网络分析中,矩阵分解是常见的方法。由于许多网络都可以抽象为矩阵的形式,社会网络分析的算法可以以矩阵计算的方式实现。因此,了解并实现对大规模稀疏矩阵的分解,能够解决许多现实问题(如:电影推荐)。基于此,改进了并行SVD++算法,基于PowerGraph提出学习率可调的并行SVD++算法LRA-PSVD++(Learning Rate Adjustment Parallel SVD++Algorithm)。经实验验证,LRA-PSVD++提高了算法精度,此外,实验证明了算法具有可扩展性。3)基于PowerGraph的并行重构算法网络的拓扑结构与其许多基本特征有很大关系。同配性是网络宏观拓扑的一个重要特征,同配性的改变意味着网络拓扑结构的改变。通过网络重构,构造出具有不同同配系数的网络,有助于分析同配性对网络其他特征(如:传播特征、鲁棒性)的影响。基于此,以增强网络同配性为目标,在保持度序列不变的条件下提出了基于PowerGraph的并行随机重构算法PRRWA(Parallel Random Rewiring Algorithm)。通过实验对算法的可行性与可扩展性进行了分析。
其他文献
软件复用是指重复使用已有的软件产品用于开发新的软件系统,以达到提高软件系统的开发质量与效率,降低开发成本的目的。构件技术是支持软件复用的核心技术。构件技术的不断发展
随着近年来无线通信技术、传感器技术、低功耗嵌入式技术以及一系列相关技术的高速发展和广泛应用,无线传感器网络的实用性和可靠性都得到极大提升,被广泛应用于环境监测、军
现有的搜索引擎在查全率和查准率方面很难满足用户的要求,为了查询到一个相关的内容,用户常常需要使用多个搜索引擎查询相同的内容,然后综合出最适合自己的结果。元搜索引擎
互联网的快速发展和广泛普及使得网站和网页信息量呈爆炸性的趋势增长,互联网已变成了一个巨大的、分布广泛的全球性信息服务中心。虽然在该信息服务中心中非结构化或半结构化
随着计算机科学与技术、控制理论以及网络技术的快速发展,仿真技术也逐渐发展起来,现在,信息处理技术的突飞猛进,更使得仿真技术得到了快速的发展。计算机仿真技术是用计算机软件
全局光照明一直以来都是计算机图形学研究的热点。随着电影、动画、游戏、虚拟现实、三维漫游等领域的应用不断深入与普及,人们对计算机生成的图像的真实感要求越来越高。全
波兰学者Z.Pawlak提出了粗糙集理论,它是能够有效处理不完整和不确定性信息的数学工具。经典粗糙集理论是基于等价关系和划分的,只有完备的离散型数据集中的属性才能导出论域
CAD建模和CAE分析是产品设计开发过程中的两个重要阶段。目前,在数字化产品开发中,一般是先使用CAD系统建立和修改产品的几何模型,然后使用CAE系统将几何模型网格化后,再进行
随着云计算受到越来越多的关注,许多大型网络公司也对其产生了浓厚的兴趣,云计算环境与传统网络环境的结合已经是不可避免的趋势。而对用户来说,每天面对处于不同域的网站,要进行
图像匹配是指将不同时间、不同成像条件下获取的的两幅或多幅图像进行空间上的对准,确定图像之间的几何映射关系,进而使得图像能够匹配的过程。作为计算机视觉的核心技术之一