基于单目视觉的人体检测和运动恢复

被引量 : 0次 | 上传用户：dafsgdfgd

【摘要】

：

人体检测与运动恢复是当前人工智能和计算机视觉领域研究的热点,已广泛应用于车载辅助系统、智能监控系统、人机交互以及体育运动训练等领域。对人体检测问题的有效解决能够

【作者】

：

丁建浩

【发表日期】

：

2013年期

【关键词】

：

人体检测混合特征级联分类器多示例学习部位检测器骨架抽取运动恢复

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人体检测与运动恢复是当前人工智能和计算机视觉领域研究的热点,已广泛应用于车载辅助系统、智能监控系统、人机交互以及体育运动训练等领域。对人体检测问题的有效解决能够为其他对象检测提供借鉴。直接从图像或视频中获取人体运动数据,不仅降低动作获取成本,同时,也使用户可以从大量的视频源中挖掘更多的潜在信息。基于单目视觉的人体检测与运动恢复技术主要面临以下三个难点：1)人体数据中噪声所占比例大,每帧中待检测窗口数量大,且人体所占比例极少；2)人体数据及动作具有非常大的类内散度,包括人体形态上的差异与动作差异；3)人体运动目标从三维投影到二维会造成深度信息丢失,且检测结果容易受复杂背景、遮挡、光照和外观变化影响。本文围绕基于单目视觉的人体检测、骨架抽取与运动恢复这一主线,借鉴当前一些特征抽取、机器学习、运动恢复的主流技术,提出了若干改进方法,论文的主要工作如下：(1)提出一种混合特征的人体特征描述子及快速的人体检测器。在面对复杂背景,光照及外观变化较大的场景时,单特征描述的人体检测器描述能力有限,难以满足高检率、低误报率的要求。本文通过融合图像梯度方向直方图特征与Census变换特征来提高分类器的鲁棒性。基于Adaboost学习的分类器训练过程较慢,针对此问题,通过快速特征选择、双阈值判决两方面的改进,提高了分类器的训练时间。在检测速度上,从分类器设计及目标窗口特征计算两方面做了改进。利用Cascade结构构造分类器,采用逐级排除非人体目标的策略,提高分类器检测速度。提出基于“块”更新的目标扫描策略,当检测窗口在待检测图像上滑动扫描时,只对窗口变化区域的“块”重新提取特征,计算其直方图分布来加速检测过程。实验结果表明,改进后的基于混合特征的级联AdaBoost人体检测器,可以检测静态图像中各种分辨率下的人体目标。与单特征的人体检测方法相比,在公开数据集上验证了本文方法在检测性能与检测速度上均有所提高。(2)提出一种基于多示例学习的多部位人体检测方法。由于整体滑动窗口检测方法忽略了人体的非刚性,其特征描述是建立在一个矩形窗口上。所以在处理多姿势、部分遮挡、视角变化等人体目标时鲁棒性不高。本文对基于部位的人体检测算法进行改进,根据生理结构将图像分割成若干区域,每个区域包含多个示例,利用AdaBoost多示例学习算法来训练部位检测器。然后利用各部位检测器对训练样本进行测试得到其响应值,从而将训练样本转化为部位响应值组成的低维特征向量。再用SVM方法对这些样本部位向量进行学习,最终形成部位组合分类器。在INRIA数据集上的实验结果表明,算法能改进单示例学习的检测性能,能检测出部分被遮挡的人体目标。同时评价了3种不同部位划分及其对检测性能的影响。(3)提出基于单目视觉的无标记、无初始化的人体运动恢复方法。在现有的无标记单目视频运动恢复方法中,需要在初始帧进行手工初始化。很多基于概率模型或基于学习的方法,存在着计算复杂度过高或依赖样例库等问题。本文的运动恢复工作包括直接从图像信息中抽取骨架,估计关节点初始二维坐标,并进一步恢复人体三维坐标等操作。首先,利用图像梯度变换方法从单目视频图像中自动抽取人体的线形骨架,并利用人体生理特征骨骼比例关系对骨架的主要关节点位置进行估计,从而在初始帧避免人工初始化。在比例正交投影的假设下对三维人体运动信息进行恢复,通过计算适用于人体比例因子来对每段骨骼进行恢复,利用卡尔曼滤波对每段骨骼运动进行跟踪。本方法无需对摄像机进行标定,无需专门辅助设备,对数据环境也无特殊要求。

其他文献

校本课程开发策略几种模式的比较

当前中小学校本课程开发策略有三种主要模式:需求主导模式、条件主导模式、目标主导模式.三种模式各有特点,在课程开发实践中我们必须辩证地看待校本课程的几个关键性要求,将

期刊

课程校本课程学校特色

我国职工工资增长影响因素的实证分析

改革开放以来,我国取得了巨大的经济建设成就,但相对于经济的发展,一方面是消费者物价指数的攀升,另一方是职工的工资水平增长缓慢；总体而言,职工的工资水平长期增长缓慢。为

学位

最低工资地区生产总值消费者物价指数人力资本投资

高精度光电稳定平台研究

高精度光电稳定平台安装在武器系统上,工作中既受到低频、大振幅舰船摇摆等姿态变化的影响,又受到武器系统高速运动,尤其受到武器系统发射时沿射向产生的宽频带冲击力带来的

学位

武器系统光电稳定平台有限元分析

MIMO系统的波束形成技术研究及其仿真

在现代的通信领域中发展最为活跃、具有最大市场潜力的一项技术就是移动通信技术，该技术包含移动的cdma2000、联通的WCDMA以及电信的TD-SCDMA系统。第三代移动通信技术支持数

学位

智能天线波束形成算法MIMO空时编码

位置社交网络中地理社交影响力的衡量

位置社交网络是一种日益兴起的新型社交网络,在位置社交网络中,每个用户不仅可以与其它用户建立好友关系,还可以通过签到分享自己在不同地点所参与的事件。通过挖掘用户的社

学位

社交网络随机游走位置服务结构分析

奥巴马高等教育新政与美国公立高校财政改革研究

美国高等教育的规模和质量是现代高等教育的典范,高等教育对美国经济、政治、科技和社会的发展发挥着重要的作用。美国除了拥有世界一流的私立高校外,也有优质和完善的公立高

学位

美国高等教育公立高校奥巴马新政高校财政

基于三维胞元空间的无线传感器网络路由算法研究

随着物联网(Internet of Things, IoT)蓬勃发展,作为物联网的核心组成与技术支撑的无线传感器网络(Wireless Sensor Networks, WSN)已经广泛应用到军事安全、环境保护、医疗

学位

无线传感器网络路由算法地理位置路由空洞区域三维胞元空间自适应选举机制胞元路由机制

明清金银锭成拍场“黑马”

进入新世纪以来，金银藏品中的“黑马”品种——明清金银锭在艺术品拍卖市场上脱颖而出，受到了投资收藏者的热烈追捧，成交价格迭创新高。如早在2011年中国嘉德春季邮品钱币铜镜拍

报纸

文化视野下的城市化

城市自诞生之初,就和文化产生了联系,随着城市的发展,文化和城市的互动也更加频繁。城市文化对城市发展有着非同一般的意义,城市发展的最终归宿是成为高度文明的文化指向型城

学位

城市文化文化资本文化遗产文化产业文化政策

基于机器学习的单目视频深度恢复

单目视频的深度恢复是计算机视觉领域的一个很重要的问题,尤其在3D电影越来越受追捧,各种3D设配,3D应用兴起的当下。人们越来越追求3D视觉的享受,通过对单目视频实现深度恢复

学位

单目视频深度恢复2D视频转3D视频机器学习视频分割

基于单目视觉的人体检测和运动恢复

与本文相关的学术论文