基于改进Faster-RCNN行人检测算法的研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:liuwennengqqqqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉的应用场景中,目标检测有着举足轻重的地位和极高的研究价值。所谓目标检测,就是用闭合的矩形框在图像中标定出符合任务需求的物体,并且输出该物体是行人的概率值。目前,行人检测技术已经被广泛应用于自动驾驶,智能机器人以及智能城市等领域,兼具实际应用和学术研究的价值。本文对国内外广为流传的卷积神经网络做了深入研究,并且阐述了卷积神经网络的设计方法和优化准则。现如今,随着计算机硬件的研发技术的进步,计算机的运算能力被提升到了前所未有的高度,这直接促进了基于深度学习算法进行行人检测这一技术的落地。经过在大量的公开数据集上的实验表明:应用深度卷积神经网络的行人检测算法的工作性能远远超过传统的机器学习检测方法和另外的图像处理手段。在现实生活中,存在着许多干扰因素,比如光线太强或者过于阴暗,距离远以及云雨雪雾等不理想的天气状况,这些因素直接导致采集得到的图像或者视频效果不理想,导致漏检率的升高。针对以上问题,本文提出了一种基于改进Faster RCNN的行人检测方法,主要的研究工作如下:1.运用特征图可视化方法,能够对卷积神经网络的输出层有更明确的认识。我们研究了解到特征图的抽象能力会随着网络层数的加深而变大,语义信息的抽象能力也会越来越强,但是图像的细节信息丢失比较严重,空间几何特征的表征能力减小。浅层网络拥有较小的感受野,空间信息拥有较强的表达潜力,但是,像素数量级高,语义信息抽象能力弱。在本文中,将深层语义信息和浅层高分辨率特征进行融合,对行人目标的检测标准更严格。经过实验证明,基于多尺度特征融合的Faster RCNN行人检测方法在INRIA行人数据集上的MR值下降到10.08%,在City Persons行人数据集上的MR值下降到15.21%。2.对于基于深度卷积神经网络的行人检测任务,检测框架的参数量级直接影响检测任务的检测效率。在下文中,我们以Faster RCNN为模板,借鉴Squeeze-and-Excitation Networks网络(SENet)的设计规则,重新设计了检测框架的特征提取模块。SENet以其独特的特征结构,能够学习到每个特征通道能够发挥的作用的大小,以此来强化更重要的特征并且削弱对检测任务作用小的特征。借助这种“升强抑弱”的机制,能够提高整体框架的检测性能。更重要的是,使用SENet的Faster RCNN行人检测方法并没有增加整体的参数量级。经过实验证实,使用SENet的行人检测方法在City Persons数据集上的漏检率下降到13.14%,在INRIA数据集上的漏检率下降到10.20%。3.对于目前目标检测网络采用一种池化方法对于行人检测任务普遍存在的特征提取效果不好的问题,本章提出了融合增强池化方法的行人检测网络。结合多种池化方法,通过学习机制为不同的池化操作分配不同的权值,使得网络能够拟合各种特征信息并且准确的抽象出重要的检测信息,经过多个公开数据集上与目前流行的目标检测网络训练测试对比,证实了本章的方法在行人检测领域良好的检测效果和突破成果。
其他文献
报纸
随着社会的不断进步与经济的不断发展,超市行业持续蓬勃发展。超市营运过程中仓储管理必不可少,超市仓储管理核心在于物资配送,当前物资配送主要依靠人工作业,人工作业效率较低,此外我国人力成本也越来越高,机器人配送可以较好地解决这些问题。超市仓储环境通常较为复杂,机器人在此环境实现自身的定位是目前面临的挑战,利用同步定位与地图构建(Simultaneous Localization And Mapping
学位
目前,网上购物逐渐成为当代社会主流的购物方式。与此同时,购物平台时时刻刻都在产生大量的商品评论,这些商品的评论成为了消费者是否购买该商品的重要参考依据。然而存在的垃圾评论通常会误导消费者的行为,不仅会扰乱网络购物的秩序,也极大浪费了信息资源。因此,设计一种有效识别垃圾评论的方法是十分必要的。为了提高商品垃圾评论的识别效果,本文提出了一种串联式的混合模型。该模型将残差结构添加到卷积神经网络(Conv
学位
车道线检测作为自动驾驶系统中的关键组成部分,在车辆实时定位、行驶路径规划、车道保持辅助和自适应巡航控制等应用中起着至关重要的作用。由于车道线固有的细长特性,使其在检测中容易受到严重的遮挡、恶劣的天气条件、模糊的路面等复杂场景影响。本文针对复杂场景下的车道线检测,提出了两种不同的方法。(1)基于空间特征交互的车道线检测方法(SFINet)。SFINet包括主分支和辅助分支,主分支对应基于行向的分类任
学位
电池组使用过程中考虑电池老化问题是对其实现可靠的安全监控关键问题之一。这就需要一套系统能够完高效的成此项任务,电池管理系统(Battery Management System,BMS)应运而生,荷电状态(State Of Charge,SOC)是电池管理系统管理电池组的一个重要参考之一。考虑电池老化因素的锂离子电池SOC的准确估计是BMS监控电池组全生命周期运行状态的关键参数。本文对锂离子电池SO
学位
冲压作为一种重要的金属板材成形加工方法,具有生产效率高、制件互换性好、成本低等优点,但是在冲压成形过程中由于受模具、设备、环境等多种因素影响,制件表面轮廓易产生缺陷。传统冲压件质量检测主要采用人工目检和检具测量等方法,检错率高、效率低、灵活性差。本文基于机器视觉理论,应用图像处理和深度学习技术开展冲压件轮廓缺陷检测的算法研究。首先根据实际生产中冲压件的成形过程,对冲压成形工艺原理进行分析,并讨论了
学位
推荐系统可以精确的筛选用户所需的资源,使得推荐技术在众多领域发挥了重要作用。近年来,越来越多的研究者将推荐技术用在教育领域。教育资源推荐方法中,学生的认知水平是关键因素,而认知诊断模型可以有效获取这一因素。因此,如何设计认知诊断模型,精准获取学生认知水平是非常值得关注的问题。在获得学生的认知水平后,需要合适的方法为学生进行教育资源推荐。如何设计推荐算法才能满足学生需求,为学生推荐适合的教育资源,是
学位
近年来,城镇化的进程不断加快,城市人口急速增长,给城市建设规划和设施管理造成了巨大压力,各种各样的问题更是不断涌现,如医疗困难、交通拥堵、传染病扩散快等问题,通过分析研究人群移动的聚集与分散模式得到人群的移动轨迹,可以给政府进行道路修建,城市建筑规划等构建智慧城市提供重要的数据支持。所以众多学者对人群移动模式进行了大量的分析研究,但目前大部分都是基于单数据源分析,而传统的单数据源分析具有片面性,难
学位
<正>福清市市场监管局紧紧围绕“学史明理、学史增信、学史崇德、学史力行”和“学党史、悟思想、办实事、开新局”的目标要求,高标准、高质量完成党史学习教育各项任务。充分发挥党建引领作用,结合“我为群众办实事”实践活动,履职尽责,统筹推进市场监管各项工作,服务高质量发展。
期刊
近年来,电子商务领域迎来了蓬勃发展,网络上的评论和观点也逐渐增多,情感分析任务的重要性也随之显现。传统基于规则的情感分析方法受词典、句法和未登录词等因素的影响,在处理相对复杂或口语化的文本时,效果十分有限。深度学习的方法有效的改善了这种情况,但现有深度学习方法大多并未对情感信息这一特征给予充分的关注。因此,针对两种粒度的情感分析任务,本文将基于规则的方法与深度学习方法相结合,分别提出了BHW_LE
学位