密集场景下基于Faster R--CNN的行人检测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:wmr8232123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是一种在目标检测任的基础上发展起来的,专门以行人为目标,旨在利用计算机和摄像头等设备获取行人在单帧图像及视频中准确位置的计算机视觉任务。同时,行人检测也是很多行人技术的前置技术,被应用于智能交通、安全监控、车辆辅助驾驶等多个领域,具有很高的商业价值和研究价值。然而,由于行人检测的场景复杂多样,行人密集场景下行人间的遮挡、多尺度问题、相机失焦等问题都增加了检测的难度,使用经典的目标检测算法如FasterR-CNN并不能很好地解决行人检测问题,尤其是密集场景下的行人检测问题。为了提升行人检测算法的性能,同时将图像行人检测扩展到视频行人检测中,本文对行人检测的相关算法进行了分析和研究,提出了密集场景下基于FasterR-CNN的单帧行人检测算法和视频行人检测算法。
  本文首先分析了密集场景下的行人检测问题的主要难点,提出了一种基于FasterR-CNN的多尺度密集行人检测算法。算法通过在特征提取网络中引入特征金字塔网络来解决多尺度问题,有效地提升了小尺度行人的检出率。针对密集场景下的行人遮挡问题,该算法则通过提出针对密集场景下易被遮挡的行人目标设计的损失函数等手段方法来减少行人间的遮挡对于检测效果的影响。
  进一步地,本文针对视频中存在的各类问题,在基于FasterR-CNN的多尺度密集行人检测算法的基础上,提出了一种融合多目标跟踪线索的视频行人检测算法。该算法通过引入多目标跟踪模块得到多目标跟踪线索,然后为了使用多目标跟踪线索来辅助行人检测,将多目标跟踪模块得到的跟踪框与行人检测网络的输出进行数据关联,以获得更加稳定的行人检测框。
  经多种实验验证,本文提出的算法相较于FasterR-CNN,在行人检测的平均精度和召回率等方面均有大幅提升。同时,该算法在复杂视频场景中也能保证较高的稳定性,具有良好的应用价值,并且在MOT17DET数据集上的平均精度达到了0.88,与当前其他先进算法相比具有一定的竞争力。
其他文献
学位
学位
学位
学位
学位
目前,高亮度电子源中所用光电阴极多采用具备低功函数的碱金属(包括多碱合金)或具备负电子亲和势的Ⅲ-Ⅴ族化合物半导体材料,其具有较高的电子发射能力.相对于上述传统光电阴极及其较为单一的表面结构,新兴的纳米结构与材料有望实现对入射光的可控调制,进而实现对光电子发射的操控.表面等离激元光子学主要研究亚波长金属纳米结构独特的光学性质及其电子的动力学特性,以及光与物质的相互作用过程.表面等离激元的激发会伴随
论文的主要工作包括以下几个方面:介绍了适应高动态环境特点的几项关键技术的原理:串并组合的信号快捕技术、非相干伪码延迟锁相环技术、叉积自动频率跟踪环技术和载波辅助校正伪码延时技术.在此基础上,提出了一种全数字化的高动态GPSC/A码接收机设计方案,并对其中重要的结构和参数的设计方法进行了说明.对载波频率跟踪和载波相位跟踪的性能进行了分析和比较,得出了频率跟踪与相位跟踪的噪声性能与动态性能互补的结论.
行人重识别是视频监控领域中的一项重要研究任务。作为一个实例级的识别问题,行人重识别依赖于识别特征。近年来,注意力模型越来越多地应用到了计算机视觉的各个领域中,注意力模型能着重学习输入信号中信息最丰富的部分,能有效地改善网络对于行人特征的学习能力,使得特征提取网络关注行人图像中更具有判别性的特征。现有的算法往往都只使用单一的注意力,忽略了不同注意力网络的互补作用,本文以注意力模型为核心分别对基于图像
现实世界中很多问题都可以建模为目标函数、约束条件或输入变量随时间变化的动态优化问题,传统的应用于静态环境中的粒子群算法不再适用,而诸如记忆集策略、预测策略与资源调度策略等改进策略多集中于峰数固定的情况,无法解决峰数未知的动态优化问题。鉴于此,本论文针对未知峰数动态优化问题的求解,对现有的策略进行了改进研究。  论文首先对现有的双记忆集策略进行改进。对于长期记忆集中的个体,其更新策略为选取所有优秀个
随着科技进步,我国的冶金工业水平得到了显著提高,不断提升的产量使得冶金产业的发展呈现稳中向好的趋势。由于高温熔融金属作业环境、工艺操作复杂,且在冶炼、转运及浇筑等加工处理过程中,存在大量的高温熔融物,作业现场容易发生爆炸、喷溅、泄漏、倾翻等事故,造成重大人员伤亡和设备损坏。面对此类事故,如何通过在有限时间内集结复杂多变的事故信息、执行应急响应程序、构建全方位的事故救援方案等事中控制措施将事故伤亡率