基于深度学习的行人检测技术的研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:LJX22766966
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对图像中的物体进行识别和定位已经从比较学术的问题变成和我们的生活息息相关的事情。目标检测是这些问题的底层技术,也是计算机视觉领域的基础问题之一。作为目标检测的实际应用之一,行人检测的目标是从图像中对行人目标进行检测和定位,可以使用在很多领域中,如监控、无人驾驶。相比一般的目标检测问题,行人检测的难点主要在两个方面。首先行人检测一般是从监控画面检测目标,而摄像头一般距离实际目标比较远,造成行人的尺寸通常很小而难以被检测到。第二点是行人的外观变化很大,并且包含两种变化,一种是尺寸,即行人由于具有较大的距离差异,会有多种差别很大的尺寸;另一种是外形,主要由不同的光照条件、行人的姿态和方向以及遮挡物造成。这种多变问题带来的一个影响是图像中的背景物体,如邮筒、垃圾箱等很容易与行人目标混淆。为了解决以上问题,本文主要进行了如下的工作:分析了目前被广泛使用的深度学习技术,比较了目前不同的模型结构在大型数据集上的识别性能;提出在主干卷积神经网络模型的多个不同尺度的特征上生成候选区域的方法,让候选区域的选取能够覆盖更多尺度,从生成候选区域的输入角度减少行人尺寸小的影响;提出在优化候选区域时,使用反卷积操作放大主干卷积神经网络中的特征,以融合来自多个不同层级的卷积层输出的特征,使得到的特征同时具有丰富的低层视觉特征和高层语义信息,以及使用归一化操作避免无效融合,通过让不同层级特征互补解决行人目标多变的问题;提出通过使用对样本加权的损失函数,减少简单样本对于模型参数的影响并提高困难样本的贡献,从而解决训练样本不均衡、目标外形变化大、易与背景混淆的问题。
其他文献
全球8大汽车巨头捧场、990辆车辆参展、95台新能源汽车亮相、89款全球新车首发......2010年的北京车展,成为经济危机以来规模最大、规格最高的全球A级车展。车展上风头最盛的除了新车,还有新车背后各大品牌车型的设计掌门人。身为众多耀眼新车的真正缔造者,他们现身车展的目的不仅仅是新车推介,宣传自己品牌设计内涵,观察全球新车设计亮点才是他们此行更大的目的。近几年,国际车企纷纷在中国建立研发中心,
在日本经济由高度成长转入低成长的过程中,伴随着日本经营体制的变化,企业面临的竞争环境日益严峻化,日本劳动力市场上的一种新的人才活用战略—员工派遣体制逐步形成并发展
从股东的角度入手,依据代理理论和制度理论分析了股东的股权与身份两种股东属性对企业多元化的影响,实证发现,股权集中度降低企业的多元化水平,而股东身份的多元化则显著提高