基于深度学习的行人检测技术的研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:LJX22766966
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对图像中的物体进行识别和定位已经从比较学术的问题变成和我们的生活息息相关的事情。目标检测是这些问题的底层技术,也是计算机视觉领域的基础问题之一。作为目标检测的实际应用之一,行人检测的目标是从图像中对行人目标进行检测和定位,可以使用在很多领域中,如监控、无人驾驶。相比一般的目标检测问题,行人检测的难点主要在两个方面。首先行人检测一般是从监控画面检测目标,而摄像头一般距离实际目标比较远,造成行人的尺寸通常很小而难以被检测到。第二点是行人的外观变化很大,并且包含两种变化,一种是尺寸,即行人由于具有较大的距离差异,会有多种差别很大的尺寸;另一种是外形,主要由不同的光照条件、行人的姿态和方向以及遮挡物造成。这种多变问题带来的一个影响是图像中的背景物体,如邮筒、垃圾箱等很容易与行人目标混淆。为了解决以上问题,本文主要进行了如下的工作:分析了目前被广泛使用的深度学习技术,比较了目前不同的模型结构在大型数据集上的识别性能;提出在主干卷积神经网络模型的多个不同尺度的特征上生成候选区域的方法,让候选区域的选取能够覆盖更多尺度,从生成候选区域的输入角度减少行人尺寸小的影响;提出在优化候选区域时,使用反卷积操作放大主干卷积神经网络中的特征,以融合来自多个不同层级的卷积层输出的特征,使得到的特征同时具有丰富的低层视觉特征和高层语义信息,以及使用归一化操作避免无效融合,通过让不同层级特征互补解决行人目标多变的问题;提出通过使用对样本加权的损失函数,减少简单样本对于模型参数的影响并提高困难样本的贡献,从而解决训练样本不均衡、目标外形变化大、易与背景混淆的问题。
其他文献
素描是一切造型的基础,素描课程也是我们初中美术班的基础课程,如果要想取得理想的教学效果,除了学生平时刻苦努力之外,教师的教学方法也很重要,注重循序渐进 , 因材施教 ,
本文介绍一种由8031单片微计算机作为数字控制器的高性能数字定位系统,阐述了以PWM开关放大器为核心的硬件电路原理和基于双模控制设计思想的软件设计方法,实验结果表明该方
全球8大汽车巨头捧场、990辆车辆参展、95台新能源汽车亮相、89款全球新车首发......2010年的北京车展,成为经济危机以来规模最大、规格最高的全球A级车展。车展上风头最盛的除了新车,还有新车背后各大品牌车型的设计掌门人。身为众多耀眼新车的真正缔造者,他们现身车展的目的不仅仅是新车推介,宣传自己品牌设计内涵,观察全球新车设计亮点才是他们此行更大的目的。近几年,国际车企纷纷在中国建立研发中心,
期刊
在日本经济由高度成长转入低成长的过程中,伴随着日本经营体制的变化,企业面临的竞争环境日益严峻化,日本劳动力市场上的一种新的人才活用战略—员工派遣体制逐步形成并发展
本文在混合式直线步进电动机的力移特性计算中引入齿层比磁导方法,有效地计及该类电机实际运行中的饱和效应.基于文中所建立的直线步进电动机的非线性磁网络模型而求得的静态
一直以来体育课都是我国各个教育阶段的必修课,其对于学生的综合发展有着重要作用,自体育课程开设伊始,课程教学都是以实践为主要方式,即使是面临着体育教学的改革,也仅仅是
社会主义民主和党内民主是两种不同而又密切联系的民主。为了使读者更好地理解社会主义民主和党内民主的内涵及其差异,正确地理解和坚持民主集中制的原则,更好地行使民主监督的
首先介绍了PCI局部总线的信号定义、协议及读写时序,然后给出PCI GPS接收卡的实现方案,并介绍了PCI9025接口芯片、MAX2740射频前端及GP2021十二通道相关器性能特点及技术指标。
从股东的角度入手,依据代理理论和制度理论分析了股东的股权与身份两种股东属性对企业多元化的影响,实证发现,股权集中度降低企业的多元化水平,而股东身份的多元化则显著提高