基于图数据库的图计算平台框架的设计与实现

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:tswdforu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着如今已经全面移动互联网时代和大数据时代,社交网络和知识图谱等领域已经得到了越来越多的研究和关注,这些领域的数据彼此之间有着很强的关联性,传统的关系型数据库在处理关联性数据时要进行大量的表连接从而造成效率低下以及时间开销很大。面对这样的应用场景所带来的问题,产生了图数据库技术并得到了飞速的发展。而Neo4j作为目前市场上名列前茅的图数据库以及图计算领域的Spark GraphX在这样的背景下都得到了越来越广泛的应用。但是,众多的图数据库也为开发人员带来了不便,因此本文希望设计一个统一的、可扩展的图计算平台框架,能够覆盖底层不同图数据库,而统一上层的应用和展示接口。本文以图数据库Neo4j和图计算引擎Spark GraphX为例,设计并实现了一个图计算平台框架。框架在整体设计层面划分为持久模块、算法模块、控制模块和应用模块。在模块的实现代码层面引入了简单工厂、工厂方法、抽象工厂设计模式,从而让整个框架实现了解耦合与可扩展。本文对框架的持久模块与部分算法模块的接口进行了实现,包括图数据生成器、Neo4j导入器以及HDFS导入器,以及SSSP、PageRank、节点中心度、三角形计数等图算法,并通过D3.js框架进行计算结果的可视化展示。最后将本文设计与实现的图计算平台框架应用到推荐系统,实现了基于PersonRank算法的二分图推荐,更进一步的将图数据库Neo4j与图计算引擎Spark GraphX的技术应用到实际场景中。
其他文献
目的研究子囊菌铬对糖尿病大鼠血糖的影响.方法链尿佐菌素(streptozocin,STZ)按体重剂量(60 mg/kg)腹腔内单次注射制作糖尿病大鼠模型.将糖尿病大鼠随机分为3组:糖尿病对照组
目的:观察针刺阳陵泉穴对针灸治疗贝尔面瘫临床疗效的影响。方法:按照随机对照的方法,将符合纳入标准的60例贝尔面瘫患者,采用随机数字表法随机分为观察组、对照组,每组各30例。观察组采用常规针灸加针刺双侧阳陵泉治疗,对照组采用常规针灸治疗,均以10天为一个治疗周期,共治疗两个周期。记录2组患者治疗前及每一个治疗周期结束后的面神经功能分级,根据面神经功能分级进行疗效统计,痊愈患者记录痊愈天数,然后通过统
目的本研究通过分析高血压脑出血(hypertensive intracerebral hemorrhage,HICH)保守治疗的患者发病入院时的血清镁离子与脑血肿增长体积,以及患者出院3个月后预后之间的相关性,从而进行经验总结,找出三者之间的相关性,给未来的治疗方案提供更多的依据,从而使患者获取到更多的益处。方法此项研究为回顾性研究,收集鄂尔多斯中心医院神经外科2018年9月到2019年11月期间
改革开放以来,我国社会经济持续快速发展,城镇化进程加快,城市面貌日新月异。与此同时,人们的生活节奏也越来越快。无论工作还是休闲娱乐,人们都不愿在路途上花费太多时间。尤其是在工作日,准时性和高效性使人们愈加渴望缩短出行时间。然而,城市道路网拥堵的问题越来越突出,与人们的出行需求背道而驰,严重影响了城市的建设和发展。为了解决这一矛盾,城市管理者应当想方设法提高现有交通资源的使用效率。交通拥挤收费是管理
目的:2016年2月美国危重病学会(SCCM)、欧洲危重病学会(ESICM)专家共同提出了Sepsis 3.0的新的定义和诊断标准,满足感染或疑似感染的患者序贯器官衰竭评分(SOFA)≥2分即可诊断脓毒
目前,全省已进入森林防火季节,各地务必提高警惕,克服麻痹思想,切实加强对森林防火工作的领导,严格按照国家和省颁布的森林防火条例,落实各项防范措施,防止森林火灾的发生,确
我国草木樨资源丰富,分布广泛,1942年天水水土保持科学试验站引种原产美国的白花(北极)草木樨和黄花(马德里)草木樨两个栽培品种,用于农地作绿肥牧草和保持水土试验,并在附近
测量断裂带土壤气浓度变化,是监测断裂活动性和地震危险性的重要途径之一。2014年5月,我们在怀来地区新保安-沙城断裂测量了断层土壤气H2、He、CO2、Rn、Hg浓度以及CO2、Rn、
目的观察中医辨证治疗结合西医治疗慢性肺源性心脏病急性加重期的临床疗效。方法182例患者随机分为两组。西医组(87例)采用西药治疗,中西医组(95例)在西医组治疗基础上加中医辨证
选取2003年1月至2011年12月宁夏及邻区发生的201个ML2.0以上地震事件进行反演,用经验格林函数计算得到本区地震震源谱衰减模型。在已知非弹性衰减系数和场地响应的条件下,计算得