静态图像中行人检测方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:lpflpf7337
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测是计算机视觉方向一个非常重要的研究课题,在智能视频监控、车辆辅助驾驶和行人动作分析等方面发挥着至关重要的作用。由于光线强弱变化、行人姿态迥异、行人间相互遮挡、尺寸不一和拍摄角度的不同,加上行人检测对精度和实时性的要求较高,使行人检测成为人工智能领域的研究热门之一。  本文研究了行人检测的一些主流算法,受这些主流算法的启发,做出了改进,提出了三种新的行人检测方法,并通过实验验证了所提算法的性能优势。本文的主要贡献如下:  (1)对当前国内外行人检测的经典算法和研究现状做了大致介绍,对研究过程中出现的问题做了分析。同时详细介绍了行人检测的具体流程和涉及的一些关键技术。  (2)提出一种Subset-Haar-like中间层特征的行人检测方法。该算法采用7种Haar-like特征模板对ACF特征的10个通道,进行卷积操作,生成Subset-Haar-like中间层特征(目标特征),并结合基于决策树弱分类器的软级联框架的Adaboost分类器,形成一套完整的行人检测算法。在Inria和Caltech公开行人数据集上进行实验,验证了该算法的有效性。  (3)提出一种LFDA加权Subset-Haar-like中间层特征的行人检测方法。该算法是对Subset-Haar-like中间层特征加权组合,并使用LFDA算法学习其加权系数。实验证明该算法在保持检测准确率的同时,显著降低了漏检率。  (4)提出一种LFDA加权Subset-Haar-like检测器与ResNet残差网络融合的行人检测算法。该算法是用LFDA加权Subset-Haar-like中间层特征模型Ours2(LFDA),对Inria(Caltech)数据集训练正样本图片进行检测,分别裁剪IoU大于Thr_pos(正阈值)和小于Thr_neg(负阈值)的检测框图片作为ResNet残差网络的训练正负样本,并对正样本检测框在裁剪前进行填充(padding10%)操作,此外裁剪Inria(Caltech)训练集的真值(ground truth)图片也作为ResNet残差网络的训练正样本,将这些图片送入预训练好的ResNet152网络模型训练微调,生成最终模型,剔除Ours2(LFDA)模型中误检的非行人检测框。实验证明了该算法的有效性。
其他文献
英语语感是人们对英语语言的感觉,它包括人们对英语的语音感受、语意感受、语言情感色彩的感受等。有声作业是培养学生英语语感的好方法,但教师在运用此方法时难免会遇到各种
在初中物理教学中,摩擦力教学是非常重要的教学内容,也是物理教学的难点.教师要想让学生更好地掌握有关摩擦力的知识,提升教学效率,需要在教学中创设相关的教学情境,精心设计
初中学生还处在形象思维发展阶段,在生物教学中实施“活动教学”,可以使生物知识的呈现更加直观与形象,加深学生的理解,提升学生的探究能力.“活动教学”的开展主要有:开展游
无损检测可以在不损坏设备原材料的情况下探测到位于设备材料内部的伤痕,正因为这个特点,无损检测在工业生产中得到了广泛的应用。超声波探伤是无损检测的一种方法,相比于其
情境教学法是目前教师常用的教学方法,构建情境教学能够有效激励学生的学习潜能,让学生主动学习,提高学习兴趣.初中思想品德较为理论化且枯燥乏味,中学生由于年龄特点和心理
工业生产过程中,在一些不适合于人工作业的危险工作环境或人眼难以满足要求的场合,以及大批量工业生产中,用机器视觉检测来替代人工视觉可以大大提高生产效率和生产的自动化
基于Lyapunov稳定性理论的直接法是近几十年来电力系统暂态稳定分析的主流发展方向之一。该类方法依赖于精确的故障后系统模型,通过研究平衡点性质及其稳定域大小来判定分析暂
射孔器打靶检测装置是用来评价射孔器在高温条件下射孔性能的。该装置模拟油井下的高温环境,对射孔器的定位进行检测。射孔器材的好坏直接影响完井的工程质量,甚至影响到对油
如今,年轻人已经是手机拥有者的主力军,他们喜欢随时随地畅享沟通的乐趣。年轻人又是虚拟形象的忠实者,他们喜欢在虚拟的世界里把自己的个性充分展现,这正是网络中的“QQ秀”
生物学重要概念处于学科中心位置,对学生学习生物学及相关科学具有重要的支撑作用.在教学中,教师合理使用视频素材能让学生更好地理解生物学重要概念.但在视频素材的选用上教