MapReduce框架下基于R-树的k-近邻连接算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:edisonye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大规模空间数据的高性能k-近邻连接查询处理,研究了MapReduce框架下基于R-树索引的k-近邻连接查询处理.首先利用无依赖并行和串行同步计算的形式化定义抽象了MapReduce并行编程模型,基于此并行计算模型抽象,分别提出了R-树索引快速构建算法和基于R-树的并行k-近邻连接算法.在索引构建过程中,提出一种采样算法以快速确立空间划分函数,使得索引构建符合无依赖并行和串行同步计算抽象,在MapReduce框架下非常容易进行表达.在k-近邻连接查询过程中,基于构建的分布式R-树索引,引入k-近邻扩展框限定查询范围并进行数据划分,然后利用R-树索引进行k-近邻连接查询,提高了查询效率.从理论上分析了所提出算法的通信和计算代价.实验与分析结果表明,该算法在真实数据集的查询上具有良好的效率和可扩展性能,可以很好地支持大规模空间数据的k-近邻连接查询处理,具有良好的实用价值.
其他文献
以河北平原中部地区为例,介绍了农业生态地质结构的概念、功能、类型和分布范围,分析了该地区生态农业的特点,论述了农业生态地质结构与生态农业的关系,提出了符合实际特点的农业
为了解决高维无约束数值优化问题,借鉴协同进化和精英策略的思想,提出了M-精英协同进化算法.该算法认为,适应度较高的个体群(称为精英种群)在整个种群进化中起着主导作用.算
<正>水蛭俗称蚂蟥。中药材使用的水蛭种类主要是宽体金线蛭、菲牛蛭和日本医蛭。目前这三种水蛭的人工养殖均已获得初步成功,但仍有很多不完善的地方。仅水蛭繁殖产卵这方面
期刊
目的探讨胰腺导管内乳头状粘液性肿瘤(intraductal papillary mucinous neoplasm, IPMN)的CT及MRI表现和诊断价值。方法回顾分析经手术或超声内镜下活检病理证实的48例IPMN,
就风积和洪积形成的地质地段进行钻孔桩的施工,论述了传统的单腰带的回旋钻机钻头改为双腰带回旋钻机钻头的特点。
双重股权结构是实现公司的控制权与所有权相分离的有效公司治理手段,在制度安排上双重股权结构既有防止恶意收购、实现公司长远目标等的优点,也存在着信息披露不对等、侵占公
决定集成学习性能的主要因素是集成的个体学习器之间的差异性.使用聚类技术来加速AdaBoost.在不同噪声水平环境下,新算法的性能都接近AdaBoost.对AdaBoost噪声敏感问题提出了
2018年春季我国北方发生大规模&#39;倒春寒&#39;,果树发生了严重的冻害,造成减产或绝收。山西省吉县苹果树,大部分2017年秋季施了基肥,2018年春季施了花前肥,受冻后少果或绝
西方学者认为集体主义抑制个体创新,是否的确如此?集体主义为主导的东亚国家(中国、韩国、日本等)经济快速崛起中涌现出大量创新,有必要在这些国家检验集体主义和创新的关系
<正>人才战略是整个企业发展战略的核心。在中小企业的生存与发展过程中,人才起了关键性的作用。目前,中小企业已经成为推动我国国民经济发展的重要力量,但是同大企业比较,中