基于深度卷积神经网络和SVM的行人检测

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:hulin99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人检测,即首先判断目标图片或者视频里面是否包含行人,如果包含行人,将行人在图片和视频中出现的位置用矩形框标定出来。行人检测和多目标检测已经成为当前计算机视觉研究的重要课题,同时在实际生活中的很多领域有着良好的应用前景,包括:智能交通,无人驾驶等。近些年,随着人工智能的发展,神经网络模型被广泛地应用到计算机视觉领域,并取得了不错的结果。因此,本文采用深度卷积神经网络和支持向量机(Support Vector Machine,SVM)相结合的方法来研究行人检测。本论文的主要工作如下:首先,制作数据集,设计网络结构,训练一个专门用于行人分类的深度卷积神经网络:PedConvNet。经过训练,该网络最终在测试集上的准确率达到了91%。其次,构造候选框生成网络,该网络的主要功能是在输入图片中,产生可能出现行人的候选框。为了设计出更精确的候选框生成网络,我们分别选取了基于AlexNet的候选框生成网络,基于PedConvNet的候选框生成网络和基于VggNet的候选框生成网络去作对比实验,实验结果表明,基于VggNet的候选框生成网络能产生更精确的候选框。然后,为了让提取到的卷积特征在SVM分类器里面有更强的区分性,表现出更好的检测性能,我们分别提取了VggNet和PedConv Net网络的全部卷积特征作对比实验,实验表明PedConvNe提取到的卷积特征比VggNet的卷积特征更适合行人分类,同时网络的深层卷积特征比浅层特征表现出更好的区分性能,并且网络特征的可视化也证实了这一观点。最后,在Caltech测试集上,本论文提出的模型在“reasonable”场景和“near”场景下的漏检率分别达到了9.1%和1.26%,从而验证了模型的有效性。
其他文献
本文深入探讨了VoIP的相关知识,分析了当前国内外的发展现状,并通过对当前热门的信令控制协议SIP协议的深入研究,提出将SIP协议应用于基于网络的实时语音通讯。SIP协议全称为
随着Web技术的迅猛发展以及多变、复杂的企业需求的快速增长,Web系统的应用越来越广泛,结构也越来越复杂,并逐渐成为下一代软件开发的主流。J2EE目前已成为Web系统最常用的系
蚁群算法(Ant Colony SyStem,ACS)是根据蚂蚁群体觅食过程中会选择最短路径行进的生物学行为发展起来的一种群体智能优化方法。该算法是一种新型的分布式优化算法,它有较强的解
工作流管理是一个被业界广泛应用并迅速发展的技术,而工作流建模是工作流技术研究的基础。本文主要是基于Petri理论对工作流建模方法和模型的分析评价方法进行研究与探索。本
人体动作识别在计算机视觉领域一直都是一个重要且具有挑战性的课题。因为其在安全监控、虚拟现实、智能人机交互等很多领域广泛的应用,正受到研究者和工业界越来越多的重视
指针分析是许多程序分析工作的基础,它从源程序中抽取各指针变量的指向信息、各表达式间的别名信息,以及其它指针相关的信息,从而使后继分析能够准确地识别各程序点上访问的存储
云计算与云服务的应用在当下互联网行业中愈发热门,这使得由云服务商组成的云服务市场在商业领域的影响也愈发广泛。云服务市场中用户与服务商的信息交流是一种动态自适应的
需求获取是系统开发过程至关重要的一步,它是用户到软件工程人员之间的一道桥梁,软件工程人员通过需求获取得到用户的意图,形成软件编制的依据。需求获取的好坏直接关系到软
H.264/AVC是由国际电信联盟和国际标准化组织共同制定的新一代视频编码标准。在编码效率、网络适应性等诸多方面都超越以往的视频编码标准。因此日益收到业界的关注。但是其
生物信息学作为一门跨学科领域,简单来说就是希望通过信息技术领域的成果来解决生物学领域待解决的问题。在生物医学工作者在日常科研工作中,当他们需要对与基因相关的疾病进行