云环境下图数据存储与并行聚类研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:sunjava2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何实现海量空间数据高效地存储管理和在线服务,同时基于这些数据挖掘用户感兴趣、有用的地学知识,成为地学领域日益关注的热点问题。目前空间数据云存储的研究大多集中在栅格数据存储和管理等方面,而针对矢量数据云存储与云服务领域研究较为零散,同时基于云存储的空间挖掘也缺乏系统的研究。本文根据矢量和栅格空间数据的不同特点,提出并实现了矢量栅格数据一体化的海量空间数据分布式云存储管理与访问服务方案,并基于云存储设计与实现了一个高效的并行谱聚类挖掘算法。主要研究内容和成果如下:1.在综述云计算、NoSQL数据库与图计算等相关领域的国内外研究现状的基础上,详细阐述了空间云存储与并行聚类的基础理论。分析了云计算模式的概念和特性以及NoSQL非关系数据库技术的起源、类型,分析了图数据库的数据模型、应用场景和传统空间存储技术的实现与局限,以及不同并行计算模型的原理、适用场合以及优缺点。2.根据矢量和栅格空间数据的不同特点,提出矢量栅格数据一体化的海量空间数据分布式云存储管理与访问服务方案。在三层式空间数据云存储架构基础上,给出基于NoSQL数据库技术的栅格和矢量数据云存储的实现策略与方法,并开展了通用数据访问接口的设计。采用分布式文件系统HDFS存储栅格数据,并使用列族数据库HBase对其建立分布式空间索引,而采用满足ACID约束的分布式图数据库Neo4J来存储矢量数据,并使用R树建立空间索引。3.探讨了基于图论的空间聚类算法——谱聚类算法原理,通过对比分析算法中不同的子图划分方法,采用DiDiC分割算法应用于并行图数据空间聚类中。同时结合并行计算框架MapReduce,提出了空间谱聚类算法流程及其基于MapReduce并行化的实现方法。4.开展了图数据的存储以及并行聚类的两个方面的试验测试。在图数据存储方面,开展了GeoDAC与PostGIS在矢量数据读写访问性能方面的对比测试。结果表明,虽然GeoDAC没有获得写入性能的加速作用,但其具有PostGIS无法比拟的强大读取性能。在图挖掘方面,开展了并行谱聚类算法与单机版谱聚类算法在图数据的挖掘效率对比测试,证明算法并行化具有显著提升图数据挖掘算法的性能。
其他文献
期刊
总结报告综合疗法治疗98例神经根型颈椎病例,结合临床资料,分析治疗结果,认为综合疗法治疗该病,标本兼顾,疗效确切,简便易行,具有较广泛的应用价值.
2007年9月,笔者在广东揭阳玉石市场上发现了一种以前少见的玉石原料。其颜色以褐黄色为主,局部有白色,整体感觉像俄罗斯的“糖玉”,不过用手掂重稍显轻。肉眼观察,其结构细腻,褐色
目的:分析在肺脓肿患者治疗中通过联合应用支气管灌洗和体位引流的治疗效果。方法:选取2018年10月-2020年2月本院74例肺脓肿患者,依据治疗方案分组为观察组、对照组,每组37例
目的:探讨艾迪注射液联合FOLFOX6方案(奥沙利铂+氟尿嘧啶+亚叶酸钙)治疗晚期胃癌的临床观察。方法:将2016年1月—2019年10月我院晚期胃癌患者52例,随机分为两组(每组26例),对
<正>颈椎病是由于椎间盘退变本身及其继发性改变刺激及压迫邻近组织,并引起各种症状体征的综合症。笔者就运用针挑疗法对30例颈椎病患者颈部功能改善的情况进行分析总结。1临
会议
用差示热分析方法研究反应性和非反应性有机硅改性的环氧树脂热焓松弛行为,并用Kohlransch-Williams-Watts方程拟合。结果表明,除了自由体积之外、分子链柔顺性是影响物理老化速度的重要因素。
作为海上油气田的生命线,深海油气输送系统面临许多潜在的危险,其中后果最严重的是油气泄漏引发的火灾爆炸事故。历史上几起严重的海洋平台破坏事故是由爆炸引起,比如"深水地
在十九大报告中明确提出“坚持住房不炒”的政策基调下,房地产行业销售额增长放缓,成交面积连续下滑,房地产融资政策紧缩,结束了高速增长的时期。房地产行业具有项目运营周期长、资本密集等特点,所以对投资测算、项目管理、资金管理、资本运营、风险控制等方面提出了更高的要求,否则难以保证资金链的正常循环,加之房价和土地成本上下两端挤压,使得房地产行业出现成本与收益不匹配,收益与现金流不匹配,仅靠过去的“粗放式”