基于云计算平台的复杂网络分析关键算法研究

被引量 : 0次 | 上传用户:ewtfgtwegv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的高速发展,将人们带入“知识爆炸”的时代,海量信息在带给人们方便的同时,也增加了人们在海量数据中获取有用知识的难度。复杂网络是20世纪以来出现的新型学科,随着大数据时代的到来,复杂网络进入快速发展的道路,在节点重要性排序、社团挖掘、传播动力学等方面开展了大量的研究,研究成果广泛应用到政治经济、社交媒体、物理生物等领域。但随着研究方法的深入与研究场景的延伸,复杂网络带给人们一个巨大的挑战是如何在大规模网络数据中有效地进行复杂网络研究分析。为应对这些挑战,人们开始使用Hadoop、Spark和GraphLab等大数据工具来进行大规模复杂网络研究分析。本文旨在针对基于云计算的复杂网络关键算法进行研究,设计并实现了三个具有代表性的复杂网络分析算法,这三个算法分别是:基于云计算的节点重要性排序算法、基于云计算的社团挖掘算法和基于云计算的SIR模型传播算法。首先,在对现有的云计算平台以及复杂网络的经典算法进行深入的研究之后,提出基于云计算,面向海量网络数据,可扩张的复杂网络分析算法。其次,根据每个算法的特点选择合适的云计算平台,设计适当的数据结构。不同的云计算平台有不同的应用场景,在合适的云计算平台上进行算法设计可以明显提高算法效率。最后,通过实验对上述三个算法进行正确性及效率验证。基于云计算的节点重要性排序算法利用LeaderRank中每个顶点只考虑与其邻居进行交互的思想,针对GraphLab和Hadoop两个平台进行算法实现。使用随机构造的小网络测试算法的准确性,使用Stanford SNAP上提供的Twitter、Friendster等顶点规模达到上千万的网络数据集来测试在面对大规模网络时的效率。基于云计算的社团挖掘算法利用标签传播的思想,针对GraphLab平台进行算法设计与实现。使用Zachary’s Karate Club这个真实社团结构以及模块度指标来测试算法的准确性,使用Stanford SNAP上的com-Orkut等公用数据集来测试算法在处理大规模网络时的效率。基于云计算的SIR模型传播算法使用度相关感染方式,模拟SIR模型。通过实验发现,本算法有很强的灵活性,可以模拟包括SI、SIS、SIRS等模型,同时在处理大规模网络时表现出高扩展性。通过大量的实验测试发现,本文提出的这三个算法在处理网络数据规模上表现出很高的扩展性,对进行大规模复杂网络分析有很大的优势。
其他文献
<正>继美国电视剧《绝望主妇》之后,大型都市剧《漂亮主妇》在中国市场引起收视热潮,这部电视剧被誉为中国版《绝望主妇》(百科名片)。两部电视剧以家庭主妇为主角,讲述了关
本文设计与实现了交通事故管理监控系统软件,系统使用较成熟的C++网络编程技术,考虑到该技术能够充分兼容Windows系列系统,提供友好的客户体验界面,对于技术的可扩展能力、交
沈阳故宫是全国仅存的中国少数民族地方政权宫殿建筑,也是除北京故宫外唯一保存完好的古代帝王宫殿建筑群。沈阳故宫是努尔哈赤时期开始营建,后经历皇太极和乾隆三个历史时期
<正> 干式气缸套的国家机械行业标准术语为:“内燃机的冷却液不直接与气缸套的外圆表面相接触的气缸套”。就我国气缸套行业厂家来说,所生产出的干式气缸套的材质多为铸铁材
移相全桥变换器移相PWM信号的产生方式主要有模拟电路控制和数字电路控制两种。首先分析了数字控制与模拟控制对系统整体性能的影响;然后简要介绍了移相全桥DC/DC变换器PWM信
<正>学者施拉姆说过,信息状况和传播方式的重大变化,总是与重大社会变革同步的。当前我国步入了改革发展的新阶段,人们的思想观念、价值信仰、思维方式等发生了重大变化,这些
物流金融是金融机构为减低交易成本和风险,利用物流企业提供的物流信息和物流监管,依据物流供应链而进行的金融活动。物流金融是现代物流的组成部分,它整合了物流领域的物流
法院案件管理系统是实现将案件业务、办公行政事务、对外交流、统计决策等业务相结合的人民法院综合信息管理系统。法院在其工作中日积月累产生了大量的档案资料。在传统的行
不锈钢酸洗是冷轧生产的第一道工序,酸洗效果的好坏直接影响后续深加工工艺的效果。目前广泛应用的HNO3+HF酸洗工艺对贫铬层去除不完全,并会产生含氮气体造成环境污染。酸洗