论文部分内容阅读
随着信息技术的迅速发展,图像数据的种类和数量不断增加。如何从大规模的图像集中检索出所需要的图像成为急需解决的问题。伴随着云计算的兴起,产生了很多分布式的编程模式,从而使得海量数据的计算变得比较容易了。MapReduce是Google公司开发的编程框架,它提供了一套可扩展的、灵活的、服务质量可靠的IT基础设施,特别是在麻烦的并行计算任务方面有着很好的解决方案。用户只需要通过编写map函数和reduce函数就可以指定任务的执行,底层run-time系统会自动通过调度大规模的集群来进行并行计算、机器故障管理、机器通信,从而十分有效地使用和管理系统的资源。在本文中,我们将建立一个分布式的图像检索系统。该系统采用基于内容的图像检索方式,并且利用MapReduce分布式计算模型来加速大图像集的检索。该系统有着很好的容错性、可扩展性、在异构环境中运行的能力。实验结果表明,在图像数据很多时候,无论图像的存储能力还是图像的检索速度,这种基于MapReduce的分布式图像检索方式相对于集中式的图像检索方式都有着更大的优势。