基于颜色和半稠密视差图像的行人检测

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:lslandgp1972
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是计算机视觉领域重要的研究课题,由于其广泛的应用场景和巨大的商业价值,一直以来都是研究的热点。  虽然行人检测经过了长期的发展,已经取得了一些进展,但其性能距离实际应用的要求依然有一定的差距,仍有很大的发展空间。目前,仅仅利用单一的颜色数据的行人检测技术已很难有较大幅度的提升,综合利用多种传感器数据和多种特征来提升检测效果是目前行人检测领域的一个新的发展方向。  三维空间信息能够直接反映检测对象的形状,已有研究证明在行人检测应用中,三维空间信息是颜色信息的很好补充,能够大幅提高行人检测的性能。但是,目前采用三维空间信息的研究大多基于微软Kinect采集的深度数据。由于Kinect设备有效采集距离短、画面范围窄且在光线较亮时采集效果差,仅适用于室内的人机交互应用,在室外的大范围行人检测应用领域中并不实用。近年来,立体匹配技术取得了长足发展。通过立体匹配技术计算得到的双目视差三维数据,具有取景范围大,有效距离广、分辨率高等特点。相较于Kinect深度数据,双目视差三维数据更适合于环境复杂的室外行人检测应用。  根据半稠密视差数据的特点,本文提出两种综合利用颜色和视差数据进行行人检测的方法:  (1)第一种方法首先利用视差数据进行粗检测,然后利用颜色数据进行精确检测,从而大大提高了检测效率,并在一定程度上减少了误检;  (2)第二种方法提出了一种针对半稠密视差数据的描述子DBLP(Disparity Block Local Parten),并设计了一种融合灰度和视差数据进行快速行人检测的方案。  两种方法从不同侧面将颜色和视差数据所提供的信息有效结合,虽然各自有不同的适用条件,但均在效果上相较传统的使用单一数据的检测方法有所提升。
其他文献
语音端点检测是语音分析、语音合成和语音识别中的一个重要环节。在实际运用中,通常要求首先对系统的输入信号进行判断,准确的找出语音信号的起始点和终止点。这样才能采集到真
云计算是一种用户可按需分配及自主配置的新型资源池,这种技术可以为用户提供计算、网络、存储等虚拟资源。作为一种为用户提供商业服务的技术,如何合理调度系统资源是云计算
目前社交网络媒体已逐渐取代传统新闻媒体,成为人们获取信息、交流观点、发表意见的主要平台。但是随着微博参与者数量的爆发式增长,用户面临“信息过载,知识缺乏”的窘境。
几乎所有的恶意程序样本都被一个可执行的保护包裹,为了静态分析恶意程序样本,必须先移除可执行保护(称之为软件反保护)。而与此正好相反,为了保护软件的核心技术不被逆向工程和未
联机分析处理(Online Analytical Processing,OLAP)是数据仓库系统中的一种多维数据分析技术,操作的对象是多维数据集。联机分析处理服务器与多维数据展示工具是联机分析处理系
随着信息化进程的不断扩大,人们将面对越来越多需要处理的数据。如何在这样海量的数据信息中便捷快速而又准确地获取所需是其中一个人们所关心的话题,搜索引擎也因此应运而生。
随着数据呈现海量式的增长方式,数据规模和数据维度都在不断增加,数据的冗余问题越来越严重,而且用户对于数据的需求也逐渐出现差异化,不同部门或者研究者对于数据的采集及处
无线传感器网络是一种由带着无线通信装置的终端节点组成的多跳的、对等的自治系统。由于其无需架设网络基础设施,组网快速灵活,具有抗毁性强,低成本和易于维护等优点,在战场通信
图像的颜色渐变,是指图像像素点的RGB颜色值按照一定的递增或者递减或者其他有规律的形式进行变化的一种方式。图像的颜色渐变是图像的重要模式之一,许多自然图像和计算机图片
揭示人类视觉机理是智能科学的重要任务之一,动态视野是评价视觉特征,进而研究视觉机理的一项重要指标,也是实现机器视觉的一个基本参数。准确评价动态视野对人脑功能、视觉机理