论文部分内容阅读
基于图像序列中运动目标检测、匹配、跟踪与识别是计算机视觉领域一个新兴的方向和备受关注的前沿课题,它结合了机器视觉、计算机科学、图像工程、模式识别、人工智能等先进技术,广泛地应用于人机交互、智能监控、机器视觉导航、工业机器人等各个方面。视频图像的智能信息一体化分析和理解是机器视觉领域研究的热点。主要包括感兴趣目标的检测、目标匹配、目标跟踪以及目标识别等关键技术。虽然已有众多研究人员开展了大量相关的研究工作,取得了较多的实验性成果,然而这些技术距离实用化还有待深入研究。本文对图像序列中的运动目标检测、目标匹配、目标跟踪以及目标的特征建模进行了研究,通过实验论证了算法的有效性和可行性,具体研究内容如下:(1)针对现有图像融合算法中现有方法的不足,以及融合指标不能很好的反映融合图像的质量,提出了一种基于非下采样轮廓波变换的优化图像融合方法,充分利用非下采样轮廓波变换的多尺度,多方向分解以及平移不变性特性,分析现有客观融合指标不能很好的反映融合图像的质量,建立了一种新的融合评价指标,利用多项式模型来拟合融合指标与非下采样轮廓波变换分解的层数关系,来指导融合,提高融合图像的质量,为后续的运动目标检测打下基础。(2)针对传统的运动目标检测算法容易受到复杂背景和噪声干扰影响,检测运动目标区域不完整,造成漏检与误检,研究VIBE算法,提出了一种改进的VIBE运动目标检测的方法。针对其前景检测以及背景更新的不足,对其进行了改进,然后采用Meanshift聚类算法对改进的运动目标检测提取的前景背景信息,包括颜色,纹理,梯度进行聚类,构建S/T网络模型,基于图割的方法,利用最大流最小割来优化提取的前景,从而实现准确的运动目标提取。改进的算法对于室内和室外场景比原始的VIBE算法的结果更加准确,有利于后续的目标匹配,跟踪和识别。(3)针对研究视角变化和重复纹理特征点匹配问题,提出了一种鲁棒的抵抗视角变化的方法-DelTri。首先针对原始SIFT匹配方法的不足,采用双边滤波进行图像预处理,更好的保存图像的边缘,扩大尺度空间极值点检测的范围,减少关键点的个数,加快关键点检测的速度,使用Sobel算子计算高斯模型的图像的梯度和方向,增强SIFT描述子的区分性,K-means聚类初始匹配的角度和尺度,去除误匹配,提高匹配的精度,然后采用Delaunay三角剖分的方法,利用其剖分的唯一性,对初始匹配点集合构建三角网,找到匹配的三角形,从而实现鲁棒的匹配。(4)针对复杂背景,光照变化,部分遮挡情况下的运动目标跟踪问题,提出基于交互多模模型粒子滤波的多特征自适应融合的目标跟踪算法。该算法采用多模粒子滤波,多模是指多个特征,用了去除背景显著特征干扰的校正背景加权直方图,对噪声不敏感而且具有良好分类精度的完备局部模式,描述局部形状和表观的方向梯度直方图,这三种特征来建模目标的特征表示,利用交互多模模型能够自适应调整模型的概率,在粒子滤波框架内进行自适应融合跟踪。多特征融合提高了跟踪算法对于复杂背景,部分遮挡的鲁棒性。(5)针对运动目标识别,以人体运动目标为模板,提出基于时空关键点描述子和运动模板的目标识别算法。首先对人体目标区域采用改进VIBE算法进行运动目标检测,得到的感兴趣区域(ROI)序列,计算相应的运动能量图像和运动历史图像。时空关键点的检测采用3DHarris检测器,关键点描述子采用3DSIFT,全局特征用Hu矩不变量来表示,进行局部特征和全局特征融合。训练分类器的模型采用支持向量机,码书构建采用词袋模型。(6)针对视频图像处理中的运动目标检测、目标匹配、目标跟踪和目标识别等关键技术存在的不同问题,基于一体化的思想,分析视频图像分析中的不同模块之间的相互影响,使各个模块之间的能够相互联系和作用,从而优化和提高系统的整体性能,为相关的部门提供决策和分析的依据。