论文部分内容阅读
随着计算机技术、信息多媒体技术快速地发展,图像信息作为一种常见的数据存储形式,正在以惊人的速度增长着。如何从海量的图像中检索出更有价值、有意义的信息,正在成为人们在图像信息利用方面最主要的诉求。本文分析了图像检索技术的发展及成果,探讨了基于文本、内容、高层语义的图像检索技术,着重研究基于内容的图像检索技术(CBIR),在总结以往图像检索系统的发展及特点和分析当前对图像检索系统的诉求的基础上,构建了在Hadoop大数据处理框架上的基于内容的图像检索系统。课题详述了大规模数据下图像检索系统的原理设计与实现细节,将图像作为用户信息的重要检索索引,结合传统信息系统的优势,使图像信息无缝整合到用户现有的业务数据中,通过这样的信息管理方式充分支持业务工作。系统利用MapReduce计算框架实现大数据下图像检索功能,提出将特定应用场景与算法(算法模型)建立关联关系的检索方式,以适应不同领域的用户需求;建立统一的算法接口规范,降低耦合度、提高扩展性,能方便地使新的算法融入到运算系统框架中;引入了“相关反馈”,的机制,通过积累反馈经验数据,持续改进优化检索参数,提高整个系统的检索精度。本课题中作者完成的主要工作如下:1.理论成果。分析并研究图像检索系统的主要理论及方法,研究国内外图像检索系统的实现方式及应用现状;研究大数据处理技术与传统系统的结合互补工作方式,探索在利用Hadoop大数据处理能力及MapReduce运算模式的基础上,将传统MIS系统与大数据处理系统结合起来,实现图像检索系统的框架模型。2.系统设计与实现。在理论研究的基础上,设计并实现了基于Hadoop框架的图像检索系统,验证了在此理论研究的基础上,实现图像检索方面的技术实施可行性,提出了基于此系统的图像检索业务上工作处理流程。3.运行系统设计实验用例,收集实验数据,分析实验数据得出结论,同时在此基础上验证了该系统的可行性。图像信息检索在科学研究及生产生活中都是一项非常重要而有意义的研究领域,本文通过理论的研究及系统的实现,找到一个具体实际可行性的图像信息检索方案及方向,满足了一定数据规模下对图像检索的诉求。