论文部分内容阅读
数码图像采集设备和互联网技术的快速发展,使得互联网中的图像以几何级的速度增长,用户在互图像海洋中寻找自己需要的内容越来越困难。因此,利用计算机提取图像的视觉内容并组织图像、同时提高图像检索和推荐的效率已经成为计算机视觉领域的一个研究热点。本文探索研究基于机器学习的图像检索和推荐相关的理论及技术,包括:图像特征的提取与组合、相似度度量、基于核方法的图像聚类、推荐图像的筛选、大规模图像高效显示与互动等,最终构建大规模图像检索与推荐系统。本文的主要工作和创新如下:(1)为准确度量图像内容相似度,提出一种基于多核距离的图像相似度组合度量方法。在提取全局和局部特征的基础上,分别构建了颜色直方图、灰度共生纹理特征、Gabor纹理特征以及SIFT关键点特征的核距离相似度矩阵,并构建成全面度量图像内容的相似度矩阵。(2)针对大规模图像数据库在特征空间上线性可分性差及聚类性能严重依赖初始类中心的问题,提出一种改善初始聚类中心的核K均值聚类算法。首先将图像特征映射到高维核空间,然后提出基于样本合并的初始样本选择算法,最终在高维核空间使用K均值算法将图像聚类。实验结果表明本文提出的改进算法相比已有的基于核的K均值算法提高了将近1%的分类准确率。(3)针对图像库中图像数量太多,全部显示困难的问题,本文设计了一种分层显示大规模图像的方法。先在各类图像中选取典型图像进行推荐,再根据用户对典型图像的选择实现图像库的过滤与检索。统计结果显示,本文方法缩短了用户检索图像的时间。(4)为解决大规模的图像数据的二维可视化问题,提出基于相似度保持投影和hyperbolic坐标变换的大规模图像可视化算法。首先使用基于核的PCA和MDS获取图像在二维空间的投影点,并利用hyperbolic变换方式将投影点进行再次变换,相比于现有的可视化方法,本文方法更加符合用户对显示结果的需求。(5)提出了一种新的基于特征方差的相关反馈框架,在用户标注图像满意或不满意后,通过计算不同特征的方差来判断用户的喜好,并根据特征方差调整相似度度量矩阵的组合系数。实验结果表明,本文方法提高了检索的准确率。(6)设计和实现了一个完整图像检索和推荐系统。系统包括大规模图像库的推荐、过滤、检索等功能。相比于已有的检索系统,本系统在检索速度、推荐图像显示方式等方面显示出独特的优势。