基于静态图像的人体检测与理解

来源 :东南大学 | 被引量 : 0次 | 上传用户:glamour269
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于图像的人体检测与理解是当前计算机视觉与模式识别领域研究的一个热门方向,在视频检索、智能安全驾驶、智能机器人和视频监控等领域有着广泛的应用前景与巨大的市场需求。人体由于自身的非刚性和所处环境的多样性,使其在图像理解过程中存在很大的挑战。最近该领域的研究取得了一些进展,但仍然存在一些急需解决的问题。自然图像中的人受各种姿态、光照条件变化与遮挡的影响,使得人体的检测尤为困难。此外在定位人的位置后,如何分析其姿态信息,推断其行为意图是一个高层图像理解问题,当前仍然是一个开放的课题,对神经认知学,视觉心理学与生理学的研究提供重要启示。本文围绕“图像中的人在做什么”这个问题,研究如何在静态图片中检测人,分析其姿态信息,推断其行为意图。本文工作主要针对以上问题,提出解决方案,所有工作总结如下:   (1)基于Boosting的实时目标检测框架中,当分类器后期应付“困难样本”时,需要组合很多弱分类器,大大增加了计算量,且性能提升较小。这个现象表明后期选择的弱分类器判别能力较弱,不能很好的区分正负样本。此外当前使用的特征描述子,忽略了样本自身固有的分布信息,而这些信息能够有效的提高特征的判别能力。针对以上问题,本文提出了一种自适应投影分块局部二进制模式特征,该特征利用机器学习的方法从训练样本中学习正负样本的分布信息并融入特征描述子,从而提高分类器的判别能力。实验结果表明,本文提出的三种自适应投影MBLBP,MBCT与MBCSLBP特征可以提高检测器训练的收敛速度,同时也提高了检测器的精度与运行速度。   (2)基于监督学习框架下的人体检测包含了一个隐式假设:所有训练样本的标记都是正确的并且检测器在这些标记区域具有最大的响应值。然而现实情况下,由于人体姿态变化,存在遮挡等外部因素,这个假设条件并不成立。此外当前的人体检测方法着重考虑人体的轮廓形状特征,而忽略了具有辅助信息的异质特征,如:纹理特征。针对以上两个问题,本文提出了一种在多示例学习框架下的Gentle MILBoosting算法与一种增强型可变尺度HOG-CSLBP特征。前者可以有效的处理样本的“误匹配问题”,而后者通过利用异质特征的互补性有效的提高检测率,降低误判率。实验结果表明本文提出的方法检测效率优于经典的HOG特征,且速度上可以实现实时检测。   (3)基于Pictorial结构框架下的人体姿态估计分为两大部分:人体部件的定位与整合部件信息的模型推理。人体部件的定位精度对姿态估计有直接的影响,尤其是在低质图像条件或出现遮挡情况时,某些“弱证据”部件会在部件定位阶段被盲目的修剪掉,从而降低部件定位的精度。此外当前的模型推理是基于部件树结构进行整体推理,运行效率不高。针对以上两个问题,本文提出了一种基于多示例学习框架下的部件检测方法与一种子图修剪策略,提高部件定位精度与模型推理效率。实验结果表明,本文提出的方法可以提高部件的检测精度,同时也提高了模型推理速度。   (4)基于经典的视觉词典框架,码元的表示缺乏语义信息,不能进行有效的知识迁徙,此外字典的学习通常使用简单的聚类算法,缺乏确凿的理论依据。针对这些问题,本文基于语义属性表示码元与基于稀疏表示理论的稀疏字典学习方法,提出了一种融入背景上下文信息的行为分类算法。该方法可以有效利用样本的背景上下文信息,减少语义属性的歧义性。实验结果表明该算法在一定程度上可以提高行为分类的精度。
其他文献
自主导航是智能移动机器人核心技术,以模仿人类认知方式的视觉自主导航成为自主导航的研究趋势。目前视觉导航算法都需要搭载高成本和高运算能力的处理器才能实现图像实时处
随着全球经济和科技研究的迅速发展,微震监测技术在国内外也得到了快速的应用发展,很多领域都利用该系统进行相关实时监测,如矿山(矿井)、隧道、石油钻井、防偷渡、汽车发动
作为一个农业大国,我国由于在农业灌溉智能控制方面的技术还不够成熟,导致农业现代化的进程比较缓慢。本文旨在设计一套智能远程供水管理系统,采用“分散控制,集中管理”的科学思
  在气象领域,各地观测站积累的海量复杂的数据一直是科学研究的对象,传统的分析方法已经无法满足研究者对数据处理的需求,数据挖掘正是在这种情况下得以运用并迅速发展起来的
双目视觉技术是计算机视觉的重要研究分支,它是通过两个摄像头在不同角度对同一景物获取二维数字图像并运用几何原理恢复三维场景信息。目前双目视觉技术已经在机器人导航、三
随着社会的发展,目标跟踪技术被应用到越来越多的领域,在多种场合发挥着重要的作用。一般传统的目标跟踪都是基于普通单摄像头的,但是这样的技术已经不能适用于很多特殊场合,
三电平逆变器作为多电平逆变器的一种,在高压大功率场合获得了较为广泛的应用。但是功率器件的增加,提高了系统的故障率,因此,如何保证系统安全运行便成为了一个重点研究的问题。本文以二极管钳位式三电平逆变器为例,分析三电平逆变器在功率管开路下的电路工作情况及故障表现形式,并由此提出了一种基于小波包变换和神经网络的三电平逆变器功率器件开路故障的检测和诊断方法。本文首先从三电平逆变器的拓扑结构和工作原理出发,
随着新能源技术的发展,微电网的应用越来越广泛。而在孤岛微电网中,使负荷在各DG间按容量比例分配是一个很重要的控制目标。而下垂控制可以在无互联的情况下进行功率分配,因此受到相关专家学者的关注,成为微电网控制的主流策略。但是由于馈线阻抗不平衡等环境因素的影响,下垂控制很难实现微电网负荷在各DG间按容量比例分配。本文对微电网中各并联DG的功率分配特性进行了深入研究,并设计了一种基于可变虚拟阻抗的功率分配
目前,随着加工任务越来越复杂,协作机器人越来越多的应用在工业生产中。其中对机器人的标定,尤其是协作机器人基坐标系的标定问题是多机器人协作研究的一个重要的课题。   本
控制河段是长江上游的重要通航河道,受不良地理和水文条件的限制,控制河段内的船舶必须接受信号台的指挥,按照单向有序的原则通过河段。如果船舶不遵守控制河段的通航规则而违规