基于Spark的空间范围查询索引研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:sandro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于传统的数据处理系统的数据存储与数据处理能力有限,不能满足处理大量数据的需求。为了发挥数据的价值,高效、高性能地处理大量数据集,提出基于Spark系统结合SIMBA的思路共同建立的大数据分析处理系统,基于Spark SQL的查询方式进行检索;在Spark中嵌入索引管理机制,将其封装在RDD内,用于提高查询效率;通过建立线段树存储数据的方式提高数据检索的效率。对于数据预处理时采用Range Partitioner分区策略的方式对数据进行分区,基于全局过滤和局部索引进行查询。保证该系统在进行查询操作时
其他文献
针对上海港口集装箱堆场交通拥堵日益严重的现状,基于交通流理论和VISSIM微观仿真软件,对港口集装箱堆场的交通流进行研究。根据交通流的理论基础,将集卡港区装卸作业与公交停靠模式进行类比,建立港口集装箱堆场的交通流模型。在上海港区实地调研数据的基础上,对建立的交通模型进行验证。通过VISSIM仿真软件对港口集装箱堆场交通流进行模拟,对比港区需求作业下不同交通量影响下的交通宏观基本图。通过控制闸口通道
针对体系对抗研究中建模仿真结果失真和海量数据挖掘功能缺失的问题,提出大数据混合仿真实验的解决方法。对大数据混合仿真实验概念内涵和外延进行阐释;对大数据混合实验引擎进行设计,提出"四层四核"的引擎逻辑架构,对其中大数据挖掘分析、仿真分析、混合控制和资源管理四个核心模块的功能定位、构成组件和内外交互关系进行细化设计。给出引擎概略的运行流程。
随着陆地油气资源开采力度的日渐加大和油气储量的不断减少,海洋石油资源已成为人们关注的焦点和新一轮油气勘探开发的热点。海洋非粘结柔性管是海洋油气输运的生命线,为了满
随着我国素质教育的改革和新课改的不断深入,我国的高中英语教育受到了教育部门和社会群体的高度关注.高中阶段被家长、教师、学生都认为是学习生涯当中最重要的阶段,同时也
计算在数学学习中十分重要,尤其是低段的计算教学,是高段计算的基础,每一学期的数学教材中都会有计算课,只有在低段打好基础才能在高段的数学学习过程中更加轻松,计算教学也
本文简述了散热降温面料以及应用于防护服的现状及发展,介绍了浙江蓝天海公司开发的蓝翔*赛尔肤冰爽散热(降温)防静电工装面料及其优良性能。
准确均匀的计量喂料装置-转子秤高长明天津水泥工业设计研究院(300400)自德国菲斯特(Pfister)公司于1985年推出第一台转子秤以来,这种构思新颖的计量喂料装置经过不断地完善与改进,现今已发展为第三代
在新课程改革标准对初中英语教学要求的推动下,初中英语教学由应试教育向素质教育模式不断转变.教师应跟随社会进步发展需求,充分利用网络资源,在传授英语知识的同时,要对学