论文部分内容阅读
随着互联网的快速发展以及越来越普及的图像获取设备如数码相机等,数字图像的数量快速的增长。人们越来越多地接触到大量的图像信息,有效地组织、管理和检索大规模的图像数据库成为迫切需要解决的问题.基于内容的图像检索应运而生,成为多媒体搜索领域的热点问题。本文介绍了基于内容图像检索的研究现状以及多示例学习的基本理论,分析了多示例学习当前的应用领域.在基于内容的图像检索框架下提出了一种基于归并的多示例学习(MergeMIL)算法。该算法有以下优点,一是对图像的自动分割作了自适应的改进,解决图像自动分割中依赖于统一参数的缺点;二是在多示例学习的支持下,考虑示例间的相互关系,解决了一般多示例学习算法因假设示例独立同分布而忽略示例内在依赖关系的缺点;三是通过聚类中心的归并提升类间的差异度,提高图像的检索精度。我们在图像数据集Corel10000上的实验结果表明:一般情况下20类图像集的识别率达到70%。而在Corel10000数据集中挑选某20类识别率能达到87.45%。100类图像集识别率为45.96%。而TOP3识别率能达到66%。我们的算法在类别数目较多时也许TOP1识别率不能达到应用的水平,但是可以将该算法作为图像初步检索,再通过其他精细的算法做进一步的判别。