基于RGB-D的室外行人检测研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:kentxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是计算机视觉领域的研究热点之一,也是智能交通和无人驾驶技术的重要研究内容;同时还是众多视觉应用的基础,比如行人跟踪与行人行为识别。目前行人检测方法从传感器角度主要可分为基于单目视觉、立体视觉以及融合视觉与激光雷达等三种方式。其中,基于单目视觉的方式容易受光照和角度的影响;立体视觉获得的深度图像具有速度较慢且不稳定的缺陷;激光雷达获取的点云则太稀疏,导致物体类别层面的识别变得困难。由于在RGB图像的基础上引入了深度图像,RGB-D图像比立体视觉产生更快更稳定的深度图以及比激光雷达提供更丰富的点云信息,因此最近几年引起研究人员的广泛关注。目前基于RGB-D的各类研究仅限于采用Kinect等可以使用的室内环境;对于室外环境,由于受到传感器等因素的限制,基于RGB-D的行人检测尚未有相关论文发表,因此非常值得研究。  本文针对行人检测的难点以及RGB-D的优势与局限性,展开室外环境下基于RGB-D行人检测的方法研究。本文的主要工作和主要贡献总结如下:  提出一套室外环境下采集RGB-D图像的方案,该方案基于普通RGB相机以及TOF相机;创新地提出一种基于针孔相机模型的图像配准方法,取得了良好的效果。  针对行人检测领域缺乏公开的室外RGB-D数据库的情况,我们建立了基于RGB-D的行人检测数据库。该数据库包含了不同时段、不同环境下拍摄的12000多张图像(对),并对数据库中的行人做了仔细的标注。针对深度相机采集的图像中存在大量噪声的问题,本文提出了一种局部方差自适应阈值的去噪方法,相比于高斯低通滤波器,该方法能够在保证图像质量的情况下有效滤除一定范围内的图像噪声。  受主动传感器可以更容易探测到空间中物体的启发,论文创新地提出了一种基于深度信息引导的行人检测框架,这种检测框架可以为RGB图像中的行人检测缩小搜索区域,从而节省大量的计算。由于基于深度图像的特征提取方法很少,本文将图像识别领域中的核化特征方法引入到RGB-D的行人检测问题中,以提升行人检测的效果。在数据融合策略上,本文改进了一种在分类器层级的融合策略,这种策略比原始的策略具有更强的自适应性,并通过实验证明了基于RGB-D的行人检测方法的可行性与有效性。
其他文献
随着互联网进入Web2.0时代,以微博、Flickr、Youtube等为代表的网站已逐渐成为新兴的各种数据产生和共享的平台。伴随而来的是文本、图像、视频和音频等信息的迅速膨胀。在网
在数字信号处理和机器学习领域中,稀疏表示是一个基础且重要的研究问题,并在大量的实际应用中均表现出优异的性能。稀疏学习是一类基于稀疏表示的机器学习方法。经典的稀疏学习
能源是人类社会赖以生存和发展的基石。激光惯性约束核聚变(ICF)技术实现了核聚变过程的可控性,该过程释放出来的巨大能量可以为人类所利用。目前,新一代高功率固体激光驱动器
管道水感应加热是利用电涡流对管壁及流水进行加热的一种技术,由于具有效率高、清洁等优点而在工业生产中得到广泛应用。随着微电子与数字信号处理技术的发展,感应加热技术正朝
该文结合高炉的实际工况条件,在大量查阅国内外相关技术文献资料的基础上,给出了基于DSP的冷却系统泄漏声谱检测的系统设计方案.该系统以TMS320C50为核心,通过对现场噪声进行
该文就是针对这种情况将预测控制与自适应控制相结合,发展了自适应预测控制, 使它同时具有预测控制和自适应控制的优点.在这种控制算法的实施中并不涉及现代控制理论中常用的
该文介绍微机控制的汽车交流发电机性能测试系统的设计方法和设计技术,主讨论了系统的结构、功能以及软硬件的设计方法.首先介绍汽车交流发电机的工作原理和性能测试方法,然
该文从中国农药业目前发展和管理现状出发,通过与发达国家对比的方法,以现代经济理论为依据,系统地分析了农药业系统各要素的问题,提出了农药业改革与发展的思路.
该文应用系统的观点,把军队看作一个大系统,分别从军队战斗力的物质系统,能量系统和信息系统的角度,分析构成军队战斗力的客观因素,得出人是战斗力物质力量的主体,是战争中一
随着移动互联网和云存储技术的发展,以及移动媒体应用与社交网络的出现,近年来多媒体数据(文本、图像和视频等)呈现出指数级爆炸式增长的趋势。图像数据作为多媒体数据的一种重要