行人目标特征表示与检测方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lishuangjie2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是计算机视觉的重要任务之一,其目标是判别一幅图像或者视频序列中是否存在行人并给出精确位置。由于行人检测关注对象是人这类特殊而重要的目标,而且还可以为图像视频检索、目标跟踪和图像分类等其它计算机视觉相关领域提供支持,因此具有重要研究意义。行人检测可应用于智能视频监控、车辆辅助驾驶以及智能机器人等领域,具有实际应用价值。  行人检测中,目标表示和目标定位是其检测框架中最主要的两个部分。表示能力强的中层特征能够增强检测模型的判别性,提高行人检测的性能。描述精确的底层特征能够用来获得行人候选区域,在全监督行人检测中可以降低检测时间,在无监督行人检测中可以降低样本搜索空间。本文针对行人检测的底层和中层特征表示,以及其在全监督和自学习行人检测器中的应用进行研究,主要工作如下:  (1)提出了基于侧输出残差网络(Side-output Residual Network,SRN)的行人底层特征提取方法。该方法使用残差单元(Residual Unit,RU)拟合残差单元的输出与真实值之间的误差。通过自深到浅依次堆叠残差单元,侧输出残差网络以拟合多尺度上的误差流替代直接拟合输出。该方法不仅可以抑制复杂背景,还可以有效地选择对称轴或边缘的尺度。将其扩展成多分支侧输出残差网络结构后,可以同时提取输入图像的对称性信息和边缘信息等底层特征。  (2)提出了基于贝叶斯得分重排序(Baysesian Scoring based Proposal Reranking)的行人候选区域提取方法。传统方法采用超像素合并的候选区域提取方式虽然能够实现精确定位,但由于无法计算置信度而存在大量冗余;采用置信度的候选区域提取方式虽然定位不精确但是可以排序。本文根据这两类方法的互补性提出了基于贝叶斯得分重排序的候选区域提取方式。对于一幅输入图像,通过多分支侧输出网络残差同时获得边缘响应图和对称性响应图,并且使用这两个响应图在贝叶斯框架下计算超像素合并产生的冗余区域的得分。选取得分高的候选区域子集在保证了召回率的前提下,降低了冗余度。  (3)提出了基于PCA卷积特征(PCA Filters Based Convolutional Channel Features,PCA-CCF)的全监督行人检测方法。在特征设计上借鉴了卷积神经网络的优点,不同的是使用PCA得到简化的卷积核,对聚合通道特征进行张量运算。该特征不仅通过PCA滤波器的正交性对聚合通道特征去相关,而且增加了更多的特征通道,以此增强表达能力。在检测框架上借鉴了R-CNN的思想,通过弱分类器获得一些候选区域之后,采用PCA-CCF并结合级联AdaBosst分类器进行精细分类。实验表明,PCA-CCF不依赖于深度学习框架缺能够有效地提高行人检测精度。  (4)合作提出了基于渐进优化模型(Progressive Latent Model,PLM)的自学习行人检测方法。全监督行人检测中,需要大量的标注样本,工作量庞大。对于特定场景的监控视频,自学习行人检测器通过渐进优化方式,迭代地进行目标发现、目标增强和标签传播,进而达到不使用任何标注样本而仅通过自动学习的方式得到行人检测器的目的。相比于传统的隐模型方法,这种渐进优化模型增加了空间约束项,在降低候选目标搜索空间的同时加强了目标定位的准确性,同时,使用基于图模型的标签传播算法获得更多的正例样本以及难反例样本,增加了分类器的多样性与判别性。
其他文献
随着我国科学技术的飞速发展,国民经济的迅速提升,人力资源的管理成为我国进一步发展的阻碍.我国一直高度重视科教文卫事业,科教文卫也因此不断的发展壮大.在这个时代的影响
微博作为一种非常流行的社交方式,可以提供海量实时的文本信息,比如新闻事件,热门评论,热点话题等信息。微博搜索与传统搜索引擎有很大不同,因其实时性和社交性特点,用户对微
该论文将要深入研究的问题是外交互通信系统的关键技术和传输协议.首先我们将详细分析TCP的传输机制以及在高延时带宽积和高突发误码率的卫星信道上效率低的原因,并按照从链
符合G.767建议的16kbit/sDCME要求在控制信道中传送的指配消息的异步数据字采用纠错码BCH(63,45),并要求一组或两组指配消息、异步数据字及其校验位和DCME帧同步字形成G.767
遥感作为一种获取地球表面信息的重要技术手段,已经在国内外得到了广泛的应用和发展.在机载遥感领域内,发展尤为迅速,各种基于PCI总线的遥感数据采集系统以其较高的传输速率
信息个性化是信息社会发展的必然趋势,因此信息安全技术的个性化也是大势所趋.该文主要介绍作者在攻读博士学位期间,在个性化信息安全技术研究与实现方面的工作.具体分成以下
该课题主要研究W-CDMA系统中NodeB基带接收方案及其FPGA的实现.Rake接收就是完成多径分离合并功能,与IS-95不同的是W-CDMA具有比其高3倍的多径分辨能力,理论分析显示,若在反
学位
随着Internet的飞速发展,基于IP网络的分组话音业务有着广阔的市场前景。SP30ITG(SP30 IP telephone gateway)是西安大唐电信有限公司研制的IP电话网关系统,采用了目前被广泛接
由于Internet取得的巨大成功,基于IP网络的业务再也不仅仅局限于传统的WEB济览,文件传送,电子邮件等点到点的尽力而为型业务,IP网络逐渐开始承载丰富多彩的群组通信及多媒体