论文部分内容阅读
海量图像检索是当前活跃的研究方向,它有着广阔的应用前景,在计算机领域中得到了广泛的关注。但同时它又是一个极为困难的问题,困难主要来源于海量图像检索环境经常是一个规模惊人的分布式图像数据库,而且检索用户一般不愿花过长的时间等待检索结果。因此,海量图像检索技术的关键在于在具有相当准确度的前提下找到一种特别高效的检索算法。为了更加高效地进行海量图像检索,两种途径被广泛采纳:采用高效的图像降维算法和采用适当的特征选择技术。
基于拉普拉斯特征映射(LE)算法的保局投影(LPP)算法不仅可以保持流形学习的能力,而且具有线性方法计算简单、直观快捷的优点。研究表明:LPP算法在用于海量图像检索时具有明显的优势。本文的工作集中于LPP算法应用于海量图像检索时的相关研究:包括LPP图像降维算法的优化研究以及结合非线性降维技术的特征选择算法研究。
1.对基于LE算法的LPP算法在图像降维方面的应用作了深入的研究,论证了LPP算法用于海量图像检索系统的比较优势。LPP算法是基于LE算法的线性扩展,兼具有非线性的LE算法和线性降维方法二者的优点。与LE算法相比,LPP算法具有一个转换矩阵,而且计算复杂度比LE算法大大降低;与其它线性算法(如PCA算法)相比,LPP算法具有较强的流形学习能力,当数据集存在非线性结构时,利用该算法更能够保留图像空间的本质特征。
2.对LPP算法应用于图像检索作了进一步的研究,介绍了一种具有代表性的LPP应用优化算法:结合相关反馈的LPP算法(FLPP算法)。然后,针对LPP算法中最近邻图并不能够总是准确地模拟数据流形,提出了一种优化的LPP算法:ILPP算法。ILPP算法通过迭代地更新最近邻图,从而使之能更好地模仿流形的局部结构。通过人脸识别的实验结果表明该算法能够有效地提高LPP算法的性能。
3.在分布式海量图像检索系统中,经常会有一些新加入的图像,大多数现有的半监督学习方法(包括基于SVM的半监督方法)在未标注数据量较大时处理效率较低。本论文提出了一种基于LPP的半监督降维学习算法一"LPP半监督算法”。该算法可以很好地辨识数据空间的流形结构,同时可以更加有效地使用未标注的数据。实验结果显示,LPP半监督降维算法的检索准确度明显高于SVM半监督方法,而且特别适用于训练样本相对缺乏的场合。最后,在对现有图像检索技术中的特征选择方法进行研究的基础上,针对海量图像检索的特点,提出了一种结合非线型降维技术的新型特征选择算法:LSDF算法。该算法具有在降维时有效辨识数据局部结构的能力,在海量图像检索使用该算法时,我们可以只花极小的计算开销得到图像数据的一个特征子集。实验结果显示,比起现有特征选择方法,LSDF算法可以明显提高检索效率。
4.由于LPP算法的特殊优点,使它特别适合应用于海量图像检索系统。但由于LPP算法提出时间不长,实际应用于海量图像检索时尚有一些基础问题需要解决。为了解决这些问题,本论文提出了几种基于LPP的优化算法,大量的实验研究及结果表明,这些方法应用于海量图像检索系统时能显著地提高图像检索的准确性和效率。