论文部分内容阅读
本文利用云计算下Hadoop平台搭建实验环境,在每个存储数据的节点上对数据建立R-树索引,将操作分散到分布式索引集群的各个节点上,同时采用云计算下现有优秀的Hadoop平台调度算法,提高Map/Reduce性能,通过设计和改进一种基于索引并行的近邻NN(Nearest Neighbor,最近邻)算法。通过实验测试,体现算法的优越性和渐进性,从而减少I/O的读取次数和CPU的计算成本,最终实现数据的查询处理优化目的。