基于Latent SVM的人体目标检测与跟踪方法研究

被引量 : 0次 | 上传用户:dtc6493829
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体目标检测与跟踪算法是计算机视觉的研究热点,其在智能交通、城市安防、人机交互、智能机器人、视频图像分析和电子娱乐等方面都有着广泛的应用。近年来,随着城市物联网的发展,人体目标检测与跟踪算法得到了越来越多的关注。本文将人体目标检测与跟踪问题分解为图像检测、背景分离、图像跟踪与路径优化等四个方面展开讨论。在图像检测方面,本文的主要研究方法是Latent SVM图像检测方法。在Latent SVM的模型训练过程中,首先对训练样本进行聚类,然后根据样本的聚类结果构建多视角的观测模型。另外,不同于一般的SVM模式识别算法,Latent SVM在一般SVM模型的基础上自动生成隐变量特征并添加到模型。隐变量具有位移和外观双重属性,因此在人体目标检测问题中,训练获取的Latent SVM检测模型可包含多个隐变量。由于隐变量可以近似地理解为人体的局部外观特征,如头部、躯体和四肢等。多模型的构建与隐变量的自动生成使得Latent SVM成为目前最好的图像检测算法之一。本文对Latent SVM方法的研究包括训练模型与检测流程两个方面。背景分离算法是视频图像检测与跟踪系统中的一种辅助方法。该方法可以提升整个系统的处理速度和精度。背景分离算法的作用是有效地去除视频图像序列的背景区域。背景部分是指图像序列中相对静止的部分,例如摇曳的树叶、转动的风扇以及移动目标的阴影等部分。在使用Latent SVM进行图像检测时,需要计算整张图像的梯度方向直方图(HOG)特征金字塔图。由于目标检测耗时与扫描区域成倍增长,因此对于一些实时性要求较高的视频图像检测系统,可以利用时间上相邻的图像相关信息快速剔除掉大部分的背景区域,减小扫描区域以提升检测速度。由于仅在前景移动区域内检测,因此该方法能极大地减小误检率。本文先后介绍了多种背景分离算法,如多元高斯混合模型算法、编码法、以及自组织映射背景分离算法。综合这些方法的优点,本文提出了改进算法。与图像检测算法相比较,图像跟踪除了需要确定跟踪目标的位置,还需要画出跟踪目标的移动轨迹。此外,图像跟踪算法还具有一定的连续性和自动性,能够弥补图像检测算法中的一些遗漏检测。本文提出了一种改进的Mean-Shift图像跟踪算法。该算法与背景分离算法结合,能够精确定位目标的跟踪位置并提升处理速度,且仅需要带入初始跟踪区域即可自动完成图像跟踪。当跟踪目标的位置发生堆叠或遮挡时,图像跟踪算法不可避免地会产生跟踪错误或丢失。跟踪路径优化算法就是要消除这些错误。结合初始跟踪对象的位置、外观信息,可以通过设计优化函数进行函数优化,从而实现多目标跟踪轨迹优化。本文提出一种改进的基于可逆转跳变马尔科夫链的蒙特卡洛优化多目标跟踪算法(reversible jump Markov chain Monte Carlo-RJMCMC)能够在较高检测正确率的情况下有效地对初始跟踪路径进行优化。初始目标跟踪轨迹由图像跟踪算法获取。在使用跟踪路径优化算法之前,首先需使用背景分离算法获取前景移动区域,然后分别对场景中的前景区域进行Latent SVM检测并对检测结果进行验证获得跟踪对象。这种处理方式能够最大化地减少误检率,并极大地简化了跟踪路径优化问题。综上所述,本文设计并尝试实现了一套完整的人体目标检测与跟踪方案,并针对各个组成模块的缺陷与不足进行了改进研究。本文的主要工作概括如下:1) Latent SVM模型训练算法的改进。由于人体目标图像具有多变性,因此隐变量的自动生成对模型的训练至关重要。在原始的Latent SVM模型训练方法中,首先根据样本图像的HOG特征由SVM算法获得简单的分类模板,然后再对分类模板使用贪心算法自动生成隐变量。为了获得更好的训练模型,本文提出一种结合Mean-shift与差分演化的图像分割算法自动生成隐变量特征。本文提出的新方法综合考虑了样本集图像的纹理分布特性自动搜索局部特征隐变量,从而获得更好的检测模型并最终提升检测性能。2) Latent SVM人体目标检测算法的改进。原始Latent SVM图像检测算法在进行目标检测时首先需构建待检测图像的HOG特征金字塔,然后将检测模型与HOG特征金字塔分别进行卷积运算,最后通过卷积得分与金字塔层数确定检测目标位置。级联Latent SVM图像检测算法是在原始Latent SVM图像检测算法的基础上进行的改进。首先使用PCA对样本集HOG特征进行分析,同时对检测模型与待检测图像的HOG特征金字塔进行降维。采用级联Latent SVM进行目标检测,再将降维后的检测模型和特征金字塔进行卷积,然后仅选择大于指定阈值的特定位置进行后续判断,即后续判断则是对原始检测模型和特征金字塔的卷积得分进行判断。级联Latent SVM方法的优点是能够快速的过滤掉图像中的非人体目标。为了进一步提升级联方法的性能,本文提出使用LDA方法分析样本集HOG特征并获得降维向量。另外,改进了级联Latent SVM提出一种改进的隐变量局部搜索策略,最后提出对隐变量进行网格颜色相似性特征提取,并建模对检测结果进行2次判定,以降低检测虚警率。3)提出一种新的自组织映射背景分离算法。经典的多元高斯混合模型及其改进的编码法都以图像中的每一个像素点为基本处理单元,这类方法中的相邻像素间没有任何相关处理,难以适应场景中存在的变化,分离结果具有较大的虚警。而自组织映射有效地解决了场景中各个像素之间的信息关联,并对场景具有较好的适应能力。但是该方法编码长度固定,需要人工干预指定编码长度,当场景突变时无法对码本进行即时修改。为此,本文提出一种结合编码法与自组织映射将相邻像素进行关联的新方法,该方法中每一个像素的背景编码长度能够根据具体情况进行自动变换,最后该方法为基础对红外线数据和彩色影像数据进行了融合,并对阴影进行了有效的去除。4)将Mean Shift算法与背景分离算法相结合给出了图像序列中多个移动目标—行人跟踪的新算法。结合背景分离算法对经典的Mean Shift算法进行了两点改进:第一,提取移动目标的有效区域,然后使用特征向量的相关函数作为跟踪对象的定位标准;第二,结合背景分离结果对跟踪区域进行快速修正。在多目标跟踪问题中,与经典的Mean-Shift算法相比,改进算法在耗时、鲁棒性和跟踪精度方面均有更好的性能。5)提出一种改进多目标跟踪路径优化算法。即使在极高检测正确率的情况下,当跟踪目标的位置发生堆叠或遮挡时,图像跟踪算法不可避免地会产生跟踪错误或丢失。本文设计的人体目标检测与跟踪系统首先使用背景分离算法获取前景移动区域,再采用级联Latent SVM进行目标检测,再由颜色相似性判定分类获取检测结果集合:最后将检测结果集合与本文提出的改进的Mean Shift算法结合获取初始跟踪轨迹。此时的初始跟踪结果能够确保极高的跟踪位置精度。针对这种情况,本文提出的改进的多目标跟踪路径优化算法对一般的优化算法进行了简化,主要包括优化公式的简化与优化策略的简化。简化后的优化算法不再采用裁剪、增长、添加、移出等策略对跟踪对象的移动轨迹进行等优化,仅采用分割、合并策略对跟踪轨迹进行优化。综上所述,本文概述并分析了人体目标检测与跟踪相关算法,并指出了各组成模块的不足。重点研究了基于Latent SVM的模型优化算法、级联Latent SVM图像检测算法、自组织映射背景分离算法、Mean-Shift图像跟踪算法、RJMCMC多目标跟踪优化算法。在研究中通过试验证明了各方法的有效性。
其他文献
口岸是国家对外开放的窗口,也是外贸进出口的通道。近年来,我国外贸进出口持续快速增长,已经连续4年保持20%以上的增长速度。2012年,我国外贸进出口总额超过3.8万亿美元,同比
20世纪90年代以来,中国互联网媒体发展迅猛,中国互联网传媒公司在大浪淘沙的残酷竞争中生存、壮大。据不完全统计,自1995年中国第一家互联网传媒类公司中华网上市以来,截至20
在当代小说史上,王安忆既以女性作家的身份为人所熟知,更以深厚的创作实力和摇曳多姿的写作风格而赢得广泛的声誉。自上个世纪80年代以来,王安忆在小说写作方面表现出来的持久
【目的】1.探讨个体化131I剂量治疗Graves甲亢的疗效;2.分析影响131I治疗效果的相关因素;3.评价131I治疗后甲减的发生情况及其影响因素;4.探讨个体化131I剂量治疗Graves甲亢相关并发
冯小刚是当前电影市场上具有鲜明个人风格的导演,其作品长期以来受到观众的普遍欢迎。为了对冯小刚电影有更加深入的了解,本文就冯小刚电影风格的转变进行研究,首先从电影市
随着国民经济的增长,我国高速公路也达到前所未有的建设时期。与此同时,由于高速公路项目建设一次性投资大,特别是高速公路沥青路面造价高昂。因此路面成本分析已成为高速公路建
大型风电场接入系统线路保护在输电线路故障时,线路保护时有不正确动作。因此,研究风电场对输电线路保护的影响具有重要的意义。本文依据双馈式风电机组的数学模型,在RTDS平台上
随着社会的发展,人们对能源的需求不断提高。在出现的各种替代能源中,生物质能源具有安全、稳定等特点,已经被人们广泛利用于农村发电、供热等方面。在我国热带地区,椰子资源
阅读教学中的逆向思维训练,有助于学生思维灵活性的培养和学习积极性的调动,影响着学生创新能力的提升。那么,在阅读教学中,教师怎样对学生进行逆向思维训练呢?一、从果溯因,
目的探讨旋转的恒定磁场(即交变磁场)对神经内分泌活动的影响及与止痛的关系,从而探索磁场止痛的机理。方法实验采用本实验室研制的WD6000多功能治疗仪,其恒定磁场强度为0.6T,转速为240转/分,对