基于卷积神经网络的多部位人体检测

来源 :北京工业大学 | 被引量 : 9次 | 上传用户:sworc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体检测的目的是识别出图像中的人体并给出其定位信息。人体检测技术在运动分析、智能监控以及驾驶辅助系统等领域有着广泛的应用,是物体检测的一个研究热点。R-CNN(Regions with Convolutional Neural Network Features)是一种基于区域的物体检测算法,该算法将选择性搜索、卷积神经网络、支持向量机和非极大值抑制相结合,在人体检测方面获得了较好的检测效果。但与众多基于整体的检测方法一样,R-CNN没有给出各个部位的位置,并在应对人体多姿态及遮挡方面存在着不足。相较于基于整体的检测方法,基于部位的检测方法能够比较有效地应对这些问题。本文在R-CNN基础上提出了一种基于卷积神经网络的多部位人体检测算法,通过训练基于人体多部位的R-CNN模型并对其添加空间几何约束,在提升人体检测准确率的同时,能够显式的给出人体各个部位的位置。在本文算法中,首先给出基于人体多部位的R-CNN模型。手工标注了一个给定人体多个部位的数据集后,对该模型进行训练。在检测时,对待检测图像,获取各个候选边框并用卷积神经网络提取其特征,通过支持向量机给出其分类的得分,再利用非极大值抑制对重叠较多的候选边框进行剔除。然后,本文算法对基于人体多部位的R-CNN模型提供的候选边框添加空间几何约束,形成预测边框组合,具体如下:将图像中的每个候选边框都假设为人体整体边框,并从剩余边框中寻找使得空间几何约束得分与支持向量机得分乘积最高的部位边框,从而得到候选边框组合,并从中选取得分超过设定阈值的候选边框组合作为预测边框组合。其中,空间几何约束包括空间位置约束、高斯混合模型约束和K近邻约束。实验结果表明,本文算法在人体检测方面取得了较好的效果,具有一定的应用价值。
其他文献
全过程游戏自动生成技术是中国科学院陆汝钤院士提出的一个构想,希望能够通过自然语言创建脚本,通过游戏脚本,添加游戏的元素最终生成一个游戏。基于游戏引擎的3D手机动画自动生
该文简要介绍了双波段红外火焰探测系统的主要设计依据,阐述了其基本工作原理,介绍了系统中与软件设计相关的硬件组成,尤其是双波段红外火焰探测器的硬件设计,并给出了控制器
关于安全博弈的研究近年来广受重视,许多基于安全博弈论的系统已在现实世界中得到了成功应用。在该研究的理论框架中,博弈双方为安保部门和不法分子。其中安保部门首先确定一种
本文的工作是为北京大学软件工程研究所正在研发的基于Erlang OTP(OpenTelecom Platform)的虚拟计算平台UniAS提供处理大文件数据的能力,设计并实现了大文件并发处理模块。本
随着网络规模的扩大和复杂性的增加,人们对集成系统和网络管理体系结构的要求越来越高.如何进行有效的网络管理,保证网络的良好运行已成为一个迫切需要解决的问题.目前的大多
三维编织技术是国外八十年代初发展起来的一种新型纺织技术.主要的两种编织方法:二步法和四步法.以往的三维编织多采用四步法进行,在这方面的织物结构研究和计算机辅助设计已
所谓“眼见为实”,通过观察一幅图像,人们可以对事物的外观信息和由其呈现出的事物性质得以直观和真切地把握。由于量子计算机的性能较之经典计算机有着本质的飞跃,以及量子计算
当前,回答集程序设计已经成为人工智能领域知识表示和推理的重要工具。它是一种描述性的问题解决框架,非常适用于对涉及常识推理的问题进行建模,并自动求解。动态逻辑程序是回答
由于互联网技术的快速发展,我们可以通过它来发布和获取各式各样的信息。所以,为了充分且有效地表示网络上丰富的数据,W3C组织提出了将XML作为互联网上信息共享的格式。XML由
近年来,随着数字化技术、信息化技术以及多媒体技术的迅速发展,有大量的数字图像、遥感图像、广告图像、路标指示牌以及微博(web)中的图像充斥着我们的生活。而这些图像中包