论文部分内容阅读
随着多媒体和互联网技术的飞速发展,人们可以随时随地进行各种各样的交流,即时聊天、观看视频、浏览网页、查找图片等等,这些交流的方法手段随着技术的进步也在不断的被人更新以及提高着。这些给人们的生活带来了巨大便利,不出门即可知天下事,想要观看视频,查找图片,鼠标轻轻一点,成千上万图像和视频都会显示出来。但是另一方面,这些图像和视频的增长也带来了一些问题,例如信息资源的浪费。我们被大量的信息充斥其中,却又缺乏知识。如何在保持数据信息足够完整的意义下从海量数据集中提取出有效而又合理的约简数据,满足存储需求和人的感知需要是亟需解决的问题。基于非监督统计的学习方法,流形学习算法给人们提供了一种思路。在对图像、视频或是其它高维数据进行处理的过程中,需要的样本的数量会以指数速度增长,随之而来的是样本间的距离也会越来越小,这就是我们所说的“维数灾难”(Dimension Curse)(?)问题。但是实验中大部分的高维观测数据各变量之间有着较强的相关性,数据集中包含着很多冗余信息,那么高维观测数据变量可以被表示为少量的几个主要影响因素。即数据主要分布在低维流形上,或者位于低维流形附近。通过学习和发现这种嵌入规律,即可找出隐藏或嵌入在高维空间中的低维流形。这就是我们研究流形学习算法的主要目标和宗旨。近年来流形学习算法由一开始的在模式识别、计算机视觉上的应用已经扩展到基于内容的图像检索、人脸识别、视频拷贝检测、医学图像处理、镜头分割等众多领域。文章中着重介绍流形学习在基于内容的图像检索和镜头分割上的应用。由于一个镜头可以看作是有相似特征视频帧的集合,基于流形学习的图像检索算法也被试着运用到视频的镜头分割上。对在视频帧集合或查询图像和图像数据库中提取的特征进行维数约减,在低维嵌入上进行欧氏距离的比较,并设定相应的阈值,在阈值范围之内的即可认为在一个镜头中或是查询图像的相似图像,反之,则属于不同的镜头或是和查询图像不相似。本论文的主要创新和贡献包括以下两个方面:(1)介绍了多种流形学习算法并将流形学习算法引入到基于内容的图像检索中。基于内容的图像检索技术的核心问题之一就是图像由特征向量表示,而这些特征向量一般都是高维向量,在庞大的图像数据库中,对高维向量进行顺序比较的过程是相当费时的。而流形学习算法的主要思想是可以有效地发现高维数据分布的内在几何结构,挖掘隐藏在高维数据中的本征信息与内在规律,实现维数约简。将流形学习算法和基于内容的图像检索技术结合起来,可以有效地解决图像特征向量这一高维向量在庞大的图像数据库查询中运用大量时间和运算量大的问题。(2)介绍了基于流形学习的镜头分割算法。一般来说镜头分割足视频处理的第一步,是基于内容的视频检索和浏览的基础,关键帧提取、高层语义分析、检索等都以此为基础。因此在镜头分割的过程中提取出有效而又约减的特征是很有必要的。文中提出的基于流形学习的镜头分割算法在实验中可以实现这一想法将视频帧作为高维向量,将其进行维数约简,有效地解决视频处理中运算量大的问题。而且将算法和经典的镜头分割算法进行比较,在准确率上有一定的提高。