基于卷积神经网络的行人检测方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:pearwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为当前计算机视觉领域一个具有挑战性的基础研究方向,行人检测问题在过去几十年里一直备受关注。数学上,作为非凸优化的一个应用,基于深度神经网络模型的行人检测算法已经取得了突破性的进步。尽管如此,在面临实际的复杂生活场景时,当前几乎还没有算法能同时满足检测准确度和速度的要求。针对这一研究问题的复杂性,本文具体研究了两类检测问题:(1)多尺度的行人检测;(2)严重遮挡的行人检测,最后试图在保证较高计算速度的前提下提升算法在上述两类复杂场景下的检测精度。当前基于深度学习的行人检测算法主要分为两阶段方法和单阶段方法。两阶段方法由于需要在特征预测前生成候选区域,因此该类方法一般检测速度受限,难以满足实际场景的检测需求。单阶段方法相较前者速度占优,但其提取到的特征信息单一,表达能力有限,导致该类方法在需要利用底层信息的小尺度行人检测任务上表现不佳。此外,传统行人检测方法仅对特征图进行一次预测,导致算法对小尺度行人的定位能力不足,当行人存在严重遮挡时则表现更差。本文将着眼于单阶段方法,拟在保持其相对于两阶段方法速度优势的同时,提升其检测精度。为此,本文提出了一种基于多层级语义融合和多级预测器的单阶段数学模型,该模型相较于传统的单阶段方法主要有两方面改进:(1)融合多层语义信息,丰富特征表达。具体而言,在特征提取阶段,将原始图片输入到可融合多层级语义的特征提取网络中,然后自顶向下,逐层地向低层特征中融入上一高层特征的语义信息,最后得到融合局部信息和全局信息的特征表达。本文模型在Caltech行人检测数据集上进行评估,实验结果表明改进方法的行人漏检率更低。(2)多阶段预测行人,增强定位能力。在改进的框架中,模型先从特征提取网络中提取到不同尺度的特征图,然后将其送入级联的预测器中。在模型训练时,使用上阶段预测的结果优化当前阶段的预测器,使得预测位置按阶段逐步靠近行人的真实位置。实验结果表明,改进方法可在速度损失较小的情况下使检测准确度得到较大提升。进一步分析发现,本文改进的模型在所有Caltech测试子集上的检测表现均比传统的单阶段方法更优,包括不同尺度和不同遮挡情况的检测任务。此外,我们的模型在检测难度更大的CityPersons数据集时也比传统单阶段方法性能更好。最后,同当前表现领先的两阶段方法相比,本文改进的方法在准确度与之具有一定竞争力的情况下保有一定程度的速度优势。
其他文献
斯皮尔伯格执导的《紫色》在当时创造了完全以黑人为主角,并且电影主创也几乎全为有色人种的纪录。影片以一种冷峻的态度,展示了20世纪初生活在美国农村的黑人的生存环境。电
在我国的环境污染中 ,火力发电是主要的污染源之一 ,并造成相当可观的环境污染损失。为了制定火力发电行业减排污染物的环境价值标准 ,笔者应用环境经济学理论 ,参考中国排污
<正> “菖蒲”之名最早出现于《神农本草经》,称其能主风寒湿痹、咳逆上气、开心巧、补五脏、通九窍、明耳目、久服轻身、不忘、不迷惑、延年。列为上品。《本草纲目》把菖蒲
公务员制度的建立是政府行政管理中的一大变革,对政府行政效率产生了积极的影响,提高了公众对政府的满意度,我国也在20世纪90年代建立了具有中国特色的公务员制度。随着社会
随着全球竞争的进一步加剧,德国越来越难以保持其工业大国的地位。美国、日本和韩国等工业化国家也正在通过各种措施加快创新速度。比如,美国借助各中东部国家的能源优势和原
新课程倡导发展性评价,建立促进学生全面发展的评价体系。小学科学课程改革中,对评价也提出了新的要求,即评价应能促进学生科学素养的形成与发展。“评价就要关注学生学习的
<正>《翻滚吧!阿信》讲述的是一个体操少年追逐梦想的故事,但作为一部讲述体操选手的电影,该影片并没有走人物传记片式的沉重路线,而是糅杂了很多深沉的东西,用台湾特有的文
设备端的通信产品要求启动快,采用FPGA芯片时,加载时间要小于2 s,针对这个要求,介绍了企业中最常用的FPGA从串加载方案,提出了一种利用CPLD提高FPGA加载速度的方案,并就改进
茶叶是近代中国对外贸易的重要商品之一,其出口趋势的变化对近代中国进出口贸易及国民经济有着不可忽视的影响。从对外贸易的一般理论出发,在现有资料的基础上,拟对近代中国
“胖”是人们日常交往过程中,仅次于男女性别的第二识别步骤,同时也是具有多重隐喻及内涵的外观形象。艺术发展至今,有越来越多的艺术家将“胖子”这一夸张的形象运用到艺术