论文部分内容阅读
多媒体内容分析在信息爆炸的时代中越来越受到人们的关注,快速膨胀的数据量及需求使得越来越多学者投入到对多媒体检索研究中。在图像搜索方面,基于内容的图像搜索技术和图像搜索重排序技术表现出突出的优势。图像搜索重排序技术以基于文本的图像搜索结果作为初始结果,再利用图像的视觉特征信息对搜索结果进行重排序的过程。然而,由于视觉特征的维数通常很高,这使得将其直接应用于排序或重排序问题比较困难;另外,传统的排序方法很难对高维的视觉特征进行高效的排序。维数约简是解决上述问题的关键技术。排序技术在多媒体检索中起着关键的作用。目的是将人们感兴趣的内容有序优先的呈现出来。由于排序的内容从传统的文本信息扩展到图像、视频等多媒体内容,排序技术也随之发展。本文系统的分析排序技术的研究现状,并将现有的技术分类,详尽的探讨了各类多媒体排序技术的特点以及其应用。维数约简是数据处理的一项重要手段。本文中,我们将样本的相关性等级信息引入到维数约简中解决图像搜索重排序问题,提高重排序的性能。线性判别分析LDA是一种利用样本的类别标记信息的有监督的维数约简方法,在分类任务中有很好的表现,但由于样本的类别标记信息不同于在排序任务中起重要作用的相关性等级信息,因此LDA不能很好的适用于排序任务。此外,LDA需要预先标记好的样本学习模型,而大量标记样本的获取通常是困难的。本文提出了一种改进的LDA算法—排序线性判别分析(Ranking Fisher Discriminate Analysis,RFDA)用于图像搜索重排序中。RFDA利用重排序中广泛存在的样本的相关性等级信息代替传统的类别标注信息并且同时利用所有标记和未标记的样本辅助学习,从而使原来的方法改进为适用于重排序任务的半监督的维数约简方法。