基于深度学习的室内监控对象身份识别方法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：cs_

【摘要】

：

【作者】

：

吴进善

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2020年01期

【关键词】

：

目标检测 YOLO 神经网络无人商店

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人体目标的身份识别是无人商店应用场景中的一个重要环节,从用户入店时的身份验证,再到店内的用户身份识别,需要同时保证识别的实时性和准确性。首先,相对于传统的目标检测与跟踪的解决思路,借鉴“仅看一眼就知道目标分类”的YOLO目标检测思想,以YOLO算法和图像特征识别算法为基础,提出了“仅看一眼就知道是谁”的研究思路,设计了室内监控对象身份识别模型。其次,对VOC数据集进行重新标注,使得标注后的数据集包含人体头部和人体方位标注。对YOLOv3训练模型配置进行改进,改进后的网络模型可以实时检测视频中的人体头部目标和输出人体方位特征。对于人物特征匹配,提出了多方位人体特征提取和分类训练的设计思想,其实现方法是对人体头部的正面、侧面和后面同时进行特征提取,并将提取到的特征向量进行分类训练,同时生成三个方位的人体特征库,其中特征提取采用LBP算法,分类训练采用SVM算法。之所以采用传统的机器学习算法,而不采用识别准确度更高的深度学习算法,主要原因是在无人商店应用场景中,会员在入店前的数据采集和动态分类训练需要保证即时性,需要在秒级中完成数据采集和分类训练,同时又要保证特征匹配的准确度。最后,将视频人体目标检测与多方位特征提取、分类训练与特征匹配相结合,对室内监控对象的身份识别模型进行实验和评价。本文通过改进目标检测训练模型,输出人体头部和人体方位特征和采用多方位人体特征提取和动态训练两个方面取得了一些进展。实验结果表明,在无人店内顾客数量少于五人时,新顾客入店前的分类动态训练时间为0.26秒,满足分类训练的即时性要求。在店内中有五名顾客时,监控视频的人体目标检测和身份识别速度每秒在25帧以上,满足场景目标识别实时性要求。在人物互不遮挡情况下,人体正面和侧面的身份识别准确度在85%以上,人体后面的身份识别准确度在60%以上,通过单摄像头视频采集,该模型可以实时检测室内场景中的人体目标和身份识别,输出会员的身份信息,基本满足模型准确度的设计目标。同时,实验也表明,当人体目标重叠度超出一定值后,单摄像头存在无法识别的盲区,当人体目标外观特征（身高、体型、服装）非常接近时,特征匹配的准确度会降低,这些还需要进一步研究与实验,包括多摄像头多视角目标检测、多特征相融合算法或目标追踪算法等研究方向。

其他文献

仿生类鱼鳍翼力学性能的数值研究

在自然选择的过程中,鱼类为了捕食猎物和躲避追捕进化出了一系列利于运动的生理结构,例如,多数鱼类都拥有的鱼鳍。鱼鳍对鱼类运动过程中推进力的产生往往起到决定性的作用。对鱼鳍运动及其流动控制机理的研究,不仅具有科学意义,还能为水下仿生航行器的设计提供有价值的参考。大多数鱼鳍的表面并不光滑,鱼鳍上射线状的鳍条与连接鳍条的薄膜形成了沟槽结构,但目前针对这种沟槽结构对流场以及力学性能的影响还鲜有研究。本文通过

学位

类鱼鳍翼沟槽结构流动机理

自治区互联网舆情监测平台的设计与实现

在互联网时代,人人都是自媒体,大家畅所欲言,在互联网上发表着自己的所见所闻和看法,同时也对他人的观点发表自己的评论,无论是正面的还是负面的信息,都会借助互联网广泛传播,形成舆论。当前,为尽可能的全面获取互联网舆情,自治区互联网信息内容监管部门采用广而多的监管模式,通过采购多个互联网舆情监测服务,对不同类型的信息,如国内外新闻、两微一端、论坛、贴吧、移动客户端等信息进行获取,然后再经过人工分析研判,

学位

互联网舆情数据融合监测

面向人机协作的ViBe安全监控方法

在“中国制造2025”的大背景下,中国的制造业近些年高速发展,机器人在制造领域的运用也越来越普及。当前,机器人技术正在经历巨大的飞跃,从起初机器人替换工人向人机合作快速发展。人机协作不仅可以拥有人的智能和灵巧等特性,还拥有了机器人的力量、速度、精度、可重复性和耐用性等优点。人机协作不仅提高成本效益比,也减轻了工人重复繁重的体力劳作辛苦。这种人机协作（Human-Robot Cooperation）

学位

机器人协作安全ViBe背景差分

数字病理图像智能诊断报告生成技术的研究

随着人工智能领域的发展,医学病理辅助诊断也有了很大的进步。在病理诊断上,恶性肿瘤的病理形态发展主要可以分为两个阶段,原位癌（非浸润型癌变）阶段,以及突破基底膜以后形成的浸润型癌变阶段。但是在大多数的研究工作中,都是针对某种肿瘤（如胃癌）发展的单一阶段（如原位癌阶段）进行诊断,并且在诊断结论上仅仅给出良恶性诊断标签。上述问题就会导致病理辅助诊断的阶段不全面性,并且未给出一定的诊断可解释性,会给病理医

学位

语义分割注意力机制数字病理辅助诊断

基于SDN的企业网络监控系统的设计与实现

基于通用X86架构的纯软件网络监控系统多采用抓包API,从网卡捕获数据包,并在用户空间完成数据包的识别和控制。由于数据包需要经过网卡驱动、内核态和用户态的多次CPU中断和内存拷贝,系统开销大,处理带宽不高,无法满足企业网络大流量环境,因此,网络监控系统的性能问题是急需解决的问题。本文的主要工作是找出传统软件网络监控系统性能瓶颈,利用SDN相关技术,设计实现可以满足企业成本和带宽需求的纯软件网络监控

学位

信息安全网络监控SDNOpenFlowOVS交换机流表时间复杂度

虚拟现实下晕动症程度预测及眼动研究

晕动症是人们日常生活中经常发生的生理现象,例如人在乘坐车、船等交通工具时。随着虚拟现实技术的飞速发展,各种虚拟现实设备出现在我们的日常使用中。但是人们在体验虚拟场景时经常会感到头晕、恶心等晕动的相关症状,这极大的降低了用户体验,并且阻碍了虚拟现实技术的推广和发展。因此,对于晕动症的研究变得十分迫切。如何去判断晕动症是否产生或者去预测晕动症的程度成为了晕动症研究领域的重要问题。针对上面的这两个问题,

学位

晕动症虚拟现实姿态摇摆深度学习迁移学习视觉显著性

心脏介入手术电磁导航中的CT与超声配准技术研究

随着基于图像引导的术中导航技术的不断发展,不同模态的医学图像配准技术在心脏介入手术中发挥着越来越关键的作用。术前CT和术中超声的配准可以帮助手术医生诊断患者的病情,更好地进行介入手术。本研究在深入了解不同模态医学图像配准的研究现状的基础上,针对传统的配准方法的优点和缺陷,提出了具有创新性的CT与超声的配准方法,与电磁导航系统相结合,用于心血管介入手术的术中引导。本研究的配准方法主要分为三个阶段。首

学位

CT超声电磁导航二维-三维配准不同模态图像配准

针对矿池与合作攻击的工作量证明协议安全性分析

比特币,承载对中心化节点的不信任,在金融危机中诞生。贯彻比特币思想的一众加密货币（不包含瑞波币等）,核心意愿是一方面以共同维护账本代替中心对支付数据不可见的存储与处理,另一方面将铸币权依去中心化程度不同分散到不同数量的参与者。工作量证明（Po W）作为占据主导的一种共识协议,设计愿景能够实现较高程度的去中心化,但由于参与者获得稳定收益的诉求,自发组成矿池,导致了算力的中心化;不诚实参与者对协议的多

学位

安全性去中心化矿池自私挖矿合作

基于IFC标准的连续梁钢筋模型自动生成

在传统设计施工模式中,基于平法施工图进行配筋信息表达,具有几何信息不明确,信息数据难以协同共享等局限性。通过BIM技术,可以有效弥补上述不足,减少材料浪费和工期延误等问题。然而BIM应用过程中,由于各方数据标准的私有性,其钢筋数据信息难以协同共享。目前,依靠人工翻模或数据接口的数据交互模式,其效率低下,费用高昂,且不可避免存在数据丢失或误差。因此,基于一种通用的数据标准,提取结构设计阶段的配筋数据

学位

建筑信息模型工业基础类钢筋模型连续梁

基于物联网（IoT）技术的集群式智能门锁的设计与实现

智能门锁系统是智能家居的一重环节,是提高家庭、宾馆和办公室等场所安全、管理效率的有效措施。据此,论文研究、设计并实现了一套面向B端市场（公租房、酒店和企业办公等）的智能门锁系统,该系统具有多元鉴权认证、视频监控、云端集群管控、移动端应急处理与无线升级等功能。此外,为了保障信息安全,论文提出了一种针对本系统改进的嵌入式终端信息传输加密方案。首先,信息传输加密层面:论文选用SM4+CTR对称加密算法,

学位

智能门锁SM4NB-IoTBLE人脸识别集群

基于深度学习的室内监控对象身份识别方法的研究

与本文相关的学术论文