基于Spark的大规模社交网络社区发现原型系统

来源 :科技导报 | 被引量 : 0次 | 上传用户:w0520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为有效发掘大规模社交网络上的用户信息,提高对用户之间关系的深入了解,设计开发了基于Spark的大规模社交网络社区发现原型系统。系统利用ActiveMQ实现对大量用户数据的抓取,使用基于Spark的MLlib提供的朴素贝叶斯算法对用户数据进行清洗,利用Spark的GraphX提供的PageRank算法和MLlib提供的Z-Score算法计算用户排名,最终应用并优化LPA算法,将特征相近、联系较密切的用户快速地划分到同一社区中,为进一步分析利用社区用户数据打下了基础。
其他文献
利用Thermo-Calc热力学软件,对ZG1Cr10MoWVNbN耐热钢在400~1600℃间存在的平衡相进行计算,并通过电化学萃取的方法制取钢中的碳化物粉末,进行XRD分析和形貌观察。结果表明:ZG1
一、满足消费安全的需要是人们消费的基本需要人们消费是要满足物质和文化生活的需要,促进体力和智力的发展。体力的恢复和发展、身体健康,是衡量消费需要满足程度的重要方面
摘要:利用FLAC3D程序对在CFG桩单桩复合地基的沉降性状进行模拟,分析其沉降随褥垫层厚度、褥垫层模量、桩长径比、桩端土与桩间土模量比等因素的变化规律,从而为CFG桩复合地基的优化设计提供依据。  关键词:CFG桩,复合地基,数值模拟,沉降     0、前言  CFG桩是水泥粉煤灰碎石桩(Cemnet Flyash Gravel Piles )的简称,是由碎石、石屑、砂石和粉煤灰组成混合料,掺入
近些年来, 随着我国国民经济的快速增长以及中部崛起战略的实施, 我国的公路、铁路、水利等大型线形工程建设得到了前所未有的发展。“经济发展, 测绘先行”。所以这些年同时也是测绘新技术、新设备高速发展的时期。目前线形工程路勘测中虽已采用电子全站仪等先进仪器设备, 但常规测量方法受横向通视和作业条件的限制, 作业强度大, 且效率低, 大大延长了设计周期。在目前的技术条件下应用GPS 技术应是首选。当前用
摘 要:影响土的强度的因素很多,包括土的内在性质和外部条件,都对试验结果起着不同的作用。直剪试验是最直接的抗剪强度的测定方法,本文主要分析了直剪试验的影响因素,对其在试验过程中的作用原理进行了定性的阐述。  关键词:直剪试验 试验过程抗剪强度结果分析  1 直剪试验概述  1.1 概念  所谓直剪试验, 是指在某一特定面上剪切土的试件,直接测定该面上的剪应力和抗剪强度的试验。直剪试验是室内测定土体
古直(1885—1959),梅县梅南滂溪村人。青年时加入中国同盟会,投身辛亥革命和讨袁护法等一系列活动。古直在参与社会变革以及从事教育的过程中,创办或参与创办了梅县梅州中学
摘要:本文主要阐述了土工格栅加筋路堤施工流程和土挡土墙的施工要点与流程,以供大家参考。  关键词:土工格栅;路堤;土挡土墙;施工流程  一、土工格栅加筋路堤施工流程   1.1基本原理   土工格栅加筋路堤,主要是利用土工格栅与土的摩擦作用、土对土工格栅的被动阻抗作用、土工格栅孔眼对土体的锁固作用以及加筋补强作用,阻止土体的位移、下沉和滑坍,提高路堤的稳定性。      1.2施工工艺流程   施
地理教师都知道,地理是一门具有人文性质的综合性学科,其中蕴含着一个最为显著的特色便是具备特别富有的人文因素。今天的地理教学应该注重的不是事物的表象、过程阐述、结论
[摘 要] 随着多媒体计算机和网络技术在教育领域的普及和广泛应用,大规模的在线开放课程(“慕课”MOOC)正迅速崛起。针对ASP.NET网站开发这样一门综合性专业课程提出将传统实体课堂与慕课相结合的教学改革思路,扩展教学渠道和丰富教学内容,进一步提高学生专业知识的掌握程度,满足社会人才的实际需求。  [关 键 词] 慕课;MOOC;ASP.NET;混合式教学  [中图分类号] G712 [文献标志
摘要:GlS和10kV变压器的安装工作是电气工程的的一个重要组成部分。其部件大,现场安装条件要求高,技术含量也比较高。本文主要针对10kV GIS和变压器安装的相关技术问题进行了探讨。  关键词:电气安装:安装工艺;技术要点  本工程主供电系统容量为10kV,30MVA。进线电压10kV经GIS送至10kV/6kv主变压器,然后经6.6kV开关柜馈电给各个电气室。下面将叙述整个安装工艺流程和要点。