基于时空分析和多粒度特征表示的人体检测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hdjc1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体检测逐渐成为近年来计算机视觉和模式识别领域中的一个研究热点。其之所以备受关注,主要出于以下两个原因:1)虽然人体检测属于一般对象识别的一个特例,但是由于其问题本身具有一般性,从而使得对于该问题的有效解决能够对其他的对象识别问题提供借鉴;2)应用上的需求进一步推动了人体检测方法的发展,例如在车载辅助预警系统、智能监控系统、人机交互系统以及基于内容的视频/图像管理系统中的应用。人体检测中的难点问题可以归结为两个方面,即低信噪比和弱配准。低信噪比是指人体数据中噪声所占比例较大而能够被用于对人体进行判别的信息相对较少。弱配准是指因人体形态上的差异而很难将人体的各个部分进行比较好的对齐。这两个难点问题综合作用结果就是人体数据具有非常大的类内散度。针对于这两个难点问题,本文分别采用了时空分析和多粒度特征表示的技术路线,并且在此技术路线的指导下,从数据预处理和特征提取两个方面提出了一系列人体检测模型和方法。论文的创新与主要贡献总结如下:(1)本文提出了一种轮廓运动特征(Contour-Motion Feature, CMF)进行鲁棒的人体描述。该特征使用时-空轮廓作为人体的底层描述,然后利用3维的距离变换来将1维的轮廓信息扩展到3维的空间中。通过这种方式,局部轮廓之间的关系可以被隐式的进行表达。通过使用3维的Haar特征对于静态和动态的特征进行统一的封装,可以进一步得到人体的中层的表达:运动轮廓特征。最后利用Boosting的方法来选择具有最强判别能力的特征用于分类。实验结果表明,该方法可以比其他同类方法具有更好的检测性能和可扩展性。此外,尽管该方法是在人体检测的背景下提出的,该方法还进一步被用于行为分析中,并且取得了较好的结果。(2)本文提出了一种多粒度特征表示方法,称为粒度可变的方向划分描述子(Granularity-tunable Gradients Partition, GGP)。针对人体数据难以进行配准的问题,本文提出了人体的多粒度特征表示方法。这里粒度这个概念表示特征对于数据的抽象能力:精细粒度特征对于数据有较低程度的抽象,具有比较好的细节描述能力,适合用于对数据进行确定性的描述;而粗糙粒度的特征对于数据有较高程度的抽象,其所体现的通常是一种统计特性。因此,多粒度特征描述意味着可以对人体数据进行不同层次的抽象,从而得到从确定性描述到统计性描述的一系列的具有不同描述特性人体表示。本文在霍夫空间中对于直线的定义进行了扩展,将直线对于旋转和平移的不确定性显式的体现在直线的定义当中,并称这类直线为广义直线,其旋转和平移的不确定性为粒度参数。进一步该广义直线被作为基元,对人体数据进行解析。通过调整粒度参数,描述子可以在不同描述特性之间切换。在精细粒度的一端,GGP可以变为一种确定性的描述,如Edgelet;而在粗糙粒度的一端,GGP可以变为一种具有统计特性的描述子,如梯度方向直方图(Histograms of OrientedGradients,HOG)。同时,梯度的位置、方向、强度和分布信息也被编码到描述子的特征向量当中,这样可以进一步增强特征的表述能力。在INRIA的人体数据库上的评测结果表明,该方法可以达到与当前领先的方法相当的检测水平,但是因为该方法中的特征和弱分类器都是线性的,所以在速度和计算复杂度上较其他方法更有优势。(3)本文提出了一种多粒度特征表示与时空分析相结合的人体检测方法,称为时-空域粒度可变的方向划分描述子(Spatial-Temporal Granularity-tunableGradients Partition, STGGP)。这种描述子融合了时空分析与多粒度特征表示的优势,因而具有更强的描述能力。根据时间信息与空间信息的相关性不同,提出了3种STGGP描述子的具体实现。在第一种实现中,不考虑运动信息与外观信息之间的相关性,将运动信息用光流梯度场表示,只将其与外观信息进行简单的串接,这种描述子称为基于光流梯度场的STGGP描述子,用STGGP of表示;在第二种实现中,用时空体上相互正交的3个切平面来表示三个坐标轴两两之间的相关性,并在这三个平面上分别提取多粒度特征,这种描述子称为基于时-空切平面的STGGP描述子,用STGGP op表示;在第三种实现中,充分考虑人体运动过程中的时-空相关性,将人体及其运动看作是3维空间中的一个实体,并且在3维霍夫空间中定义广义平面对其进行解析,称这种描述子为基于3维霍夫变换的STGGP描述子,用STGGP 3h表示。最后,将STGGP描述子用于人体检测和行为识别,实验结果表明,STGGP描述子较其他算法具有较明显的优势。(4)为了进一步提高人体检测的速度和精度,本文将背景建模和运动检测也作为一个研究内容,并将其作为人体检测的预处理过程,以达到缩小检测区域、减少误检的目的。提出了一种基于非参数模型的背景建模方法用于运动目标检测,以此来降低人体检测的误检率及提高检测速度。首先,引入了一个新的模型,影响因素描述模型(Effect Components Description, ECD),来对背景的变化进行建模。通过这个模型,可以将背景模型最好的估计与其分布的众数相关联。在ECD的基础上,进一步提出了一个有效的背景生成方法:可靠背景模型(MostReliable Background Model, MRBM)。在MRBM生成的过程中,运用mean shift来迭代找到每个像素的分布的众数。该方法的优势主要体现在三个方面:首先,非参数模型可以较好的处理多峰分布数据,该方法不需要纯净的背景作为训练,可以用于有复杂运动物体的情况下的背景模型的生成;其次,生成的背景图像质量较高,可以减轻图像中由于压缩导致的块效应且不致引入模糊;最后,背景对于短时光照变化、噪声和摄像设备的小的抖动具有鲁棒性。
其他文献
脑电技术可用于探究用户体验的脑神经机制,实时反映出用户在产品体验过程中的认知、情绪情感等特征。文章从情绪体验、认知过程两个研究方面,对这一新方法在用户体验中应用及
中国的城镇化之路正在回归多元和理性,“依托现有山水脉络等独特风光,让城市融入大自然”道出了我国现代城镇化的理念和方向。“羁鸟恋旧林,池鱼思故渊”又何尝不是现代市民渴望
前面已经提到,实际的机件总不是理想的连续体,存在着初始裂纹。由于外力的作用,在裂纹的尖端产生应力应变场,在线弹性断裂力学中,应力场用应力强度因子K来衡量。对于交变载荷,用应
随着科学技术的飞速发展,基于生物特征识别的智能身份鉴别方法因为其携带方便,易于采集,唯一性等特点而受到了越来越广泛的关注。其中虹膜识别由于具有高可靠性和非侵犯性,被
三年前,当一大批适应年轻人休闲聚会的泡沫红茶坊如雨后春笋般在沪上开出后,近来,又开始走向弱势。随着报上渐渐多起来的茶坊转让广告,人们也确实发现,许多茶坊往往茶翁之意不在茶
期刊
珠算乘除的定位方法很多,问题是有的不够简炼,记忆困难,特别是初学的人,总感到算盘好打,数位难定。往往因定位弄错的不少,确实是普遍存在的一个问题。公式定位法,虽可算前盘上定位,也
2014年5月8-12日,华南发生了连续暴雨天气过程,为了探究回流暖区暴雨和锋前暖区暴雨的成因,加深这两类不同类型暴雨的认识,利用NCEP/,NCAR的1°×1°再分析资料
随着计算机技术的发展和数据测量技术的进步,逆向工程已经成为产品设计制造的一种重要手段。从测量数据重建出物体表面的曲面表示,并最终建立CAD模型是逆向工程的根本任务。
随着新课改的深入发展,“核心素养”的理念成为了素质教育的具体延伸。同时,初中英语具有很强的基础性和适用性,教师要紧跟现代教育趋势,坚持“立德树人”的教育原则,实施初