论文部分内容阅读
随着科学技术的发展,各行各业的数据量越来越大.很多存储和计算功能单靠一台主机已无法有效处理.Hadoop 作为云计算的一种开源分布式运算框架,为大数据的并行计算处理,提供了有效处理方法.本文在hadoop框架基础上,用4台主机部署hadoop集群环境,并用实例测试hadoop集群环境的并行计算能力.通过实验证明,hadoop集群环境并行处理能力具有很好的及时性和准确性.