论文部分内容阅读
在互联网高速发展的时代,面对数据量的爆炸式增长,通过现有的数据迁移存储系统可以完成大数据量的迁移存储任务但是效率还是较低。尤其是通过对表中数据计数和基于Value值这两种方法查询时整合后的效率要远低于单独使用Hive的查询效率,远不能满足企业数据处理方面的需求。所以对于通过对表中数据计数和基于Value值这两种查询方法的效率还有提升的空间。在对表中数据计数和基于Value值两种数据查询方式进行了优化,主要使用为HBase表分配Region以及设置caching的方法。通过测试得到证明,以上两种查询方式得到