论文部分内容阅读
随着时代的发展以及因特网的日益普及,多媒体在日常生活中占据越来越重要的地位。从图像到视频,多媒体数据的日益增多使得人们对快速、有效的处理这些数据的需求逐渐提高。多媒体数据中,由于视频数据的内容丰富、信息量大,其分析处理工作一直是计算机视觉领域的研究重点。近年来,由于在特征描述以及分类器等方面的长足发展,包括运动分析、行为识别在内的多种基于计算机视觉的应用受到了研究者的广泛关注。在视频分析的诸多应用中,运动分析是其他应用的基础和核心。将视频看做是一段连续的图像,视频最大的特点就是运动。为了能更好的进行运动分析,需要将连续帧关联起来。而这种关联的关键就是匹配算法。现存的匹配算法大都属于预定义的距离度量方式。这类算法具有适应性差、匹配结果不稳定等特点。基于此,本文从匹配算法的距离度量方式入手,提出了基于自适应距离度量的学习方法,自底向上的解决运动分析问题,取得了很好的效果。本文的研究工作主要有以下3个方面:1.在类别约束下的自适应距离度量方式。在类别约束下的自适应距离度量方式能有效提高最近邻分类误差,从而达到提高匹配结果的目的。从这个角度出发,在运动分析问题中,为了使得待分析的目标物体被准确的定位,需要将其从背景中准确的区分开来。通过在运动分析中使用类别约束下的自适应距离度量方式,目标物体在特征空间中的可区分性将得到显著的提高。2.在变换式空间中的距离度量方式。除了类别约束下的自适应距离度量方式,在很多情况下,明确的类别信息无法准确的获得。我们需要从一组原始数据中进行学习。在这种情况下,引入变换式空间中的距离度量方式,试图通过特征空间投影的方式进行有效的距离度量学习,从而达到提高匹配精度的效果。3.在类别约束及变换式空间中的距离度量方式。除了单独使用在类别约束下的自适应距离度量方式和在变换式空间中的距离度量方式以外,可以同时使用这两种约束,并通过学习得到新的距离度量方式。本文的主要贡献在于:1.将自适应距离度量学习方式有效的与视频运动分析相结合。距离度量算法是视频运动分析中匹配算法的核心。以往的研究工作将距离度量算法和运动估计作为两个部分分开计算。本文首次提出了一种将自适应距离度量算法和运动分析算法统一的算法框架,并推导出在考虑自适应距离度量因素下运动估计的数学解析解。2.提出了变换式距离度量学习方法,简单、高效的解决了在没有监督式类别标注信息的情况下,不同特征空间之间的交叉学习问题。这一问题的解决,为图像超分辨率技术、运动识别技术以及运动分析算法提供了一种新的解决方案。3.解决了低分辨视频跟踪问题。由于存储及传输的限制,高分辨率的视频数据往往不易获得,运动分析需要基于低分辨的的视频数据。在这种情况下,本文提出将变换式距离度量学习的方法引入到低分辨率运动估计算法中,取得良好效果。本文以自适应距离度量的学习算法为基础,稳健的视频运动分析算法为应用,通过匹配算法将两者结合到一起。理论分析及实验结果表明,本文所提出的自适应距离度量算法应用广泛、自适性强,其在视频运动分析中的应用结果稳定,运算高效。