基于深度学习的行为识别算法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wushong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是机器视觉中的一项重点难点问题,在智能安防、智慧养老、人机交互等领域都有着广泛的应用价值。传统的人体行为识别方法需要佩戴各种传感器且识别的动作类别有限、准确率不高。随着深度学习在该领域的应用和大规模数据集的发展,人体行为识别技术取得了突飞猛进的发展。然而实际生活场景往往复杂多变,且常常包含多目标动态环境使得目前的算法无法进行有效的识别。针对目前存在的问题,本文基于深度学习算法对行为识别技术开展了以下研究:针对目前的人体行为识别算法在实际生活场景中识别准确率低、对背景变换适应性差的问题,提出了一种基于目标检测的行为识别方法。对经典目标检测算法的精度和速度等方面的优缺点以及相关理论原理进行分析,在目标检测网络模型YOLOv3的基础上训练了一个单类的人体检测器,提高了检测模块的平均准确率以及推理速度。对当前效果比较好的行为识别网络模型进行分析,使用I3D模型结构作为行为识别模块的基础网络。结合人体检测器和I3D网络模型,通过检测器获取的人体位置、存在状态等信息对于每帧图片进行预处理,获取以人体为中心的感兴趣区域,去除背景,从而提升行为识别算法对于在不同背景下的识别率。在多目标动态场景下,仅仅依靠于目标检测无法实现对特定目标的行为进行识别。针对这一问题,提出基于多目标跟踪的行为识别方法。分析了基于目标检测的多目标跟踪算法DeepSort实现原理,使用性能更加优越的目标检测器YOLOv3替换原方法中的检测器,提升跟踪算法的性能。结合多目标跟踪算法和行为识别算法,将第一帧中的目标确定为待识别目标,初始化跟踪器状态,根据人体边界框信息、以及浅层特征提取卷积神经网络得到的特征向量构建代价矩阵,然后通过匈牙利算法实现帧与帧之间的数据关联和相应目标身份匹配,跟踪特定的目标,对该目标进行行为识别,从而实现在多目标场景下对特定目标的行为进行识别。在本文的最后介绍了在实际场景中采集的测试数据集,并在此基础上对前文提出的方法进行实验验证,并基于Turtlebot机器人搭建了实时的危险行为检测系统,验证算法在不同场景下的有效性。
其他文献
NO VELL网络的NETW ARE操作系统采用四种先进技术:文件服务器、容错技术、开放协议技术、NETW ARE管理。在谈到如何选择适合自己要求的网络产品时,分析了3+网和NO VELL网的主
本文叙述了N—90集散控制系统主要设备的性能及使用方法。文中还着重介绍了应用N—90控制设备的锅炉自动系统、锅炉燃烧管理系统等9个仪表控制系统的功能、组成及调试中应注
利用启动子探针型载体pSUPV2首次从诸葛菜总DNA中克隆了7个具有启动功能的DNA片段,转化E.coli表明最高卡那霉素(kna)抗性为140μg/ml,最低为20μg/ml。含启动子片段的7个重组质粒子分别命名为pSUPZ1-7,Southren印迹表明pSUPZ6对Kna的抗性功能来源
本文介绍了对DQLT—2型励磁调节器所作的五点改进:1.改进电压测量微分电路,解决输出摆动问题;2.解决了两台调节柜并列运行中存在的主次现象,欠励、强励问题;3.改进电压放大增
知识经济是个创新的时代,中学生创新精神的培养显得更为重要和迫切。物理学史中有大量培养创新精神的素材,可被深入挖掘,作为创新精神培养的好教材,使学生从中领悟出创新思维的发
由于衍生金融工具和传统的会计要素有所区别,因此,它的出现对传统财务会计从确认、计量到披露都带来了冲击,本文就衍生金融工具的特点,分析了其与传统会计要素在会计确认和计量方
横向比较南岭走廊各瑶乡现有的民间工艺发展现状,结合当下民族旅游发展需求与各高校在传承创新民族民间文化问题上的具体实施进行客观分析,以点带面进行策略研究,提出适合南
系统地阐述了河南铝土矿的矿物组分特征,并对铝土矿普铝矿石的选矿方法进行了简析。通过采用豫西地区普铝矿石试验性生产,证实应用选矿拜耳法可以较为经济地处理普铝矿石,并收到
目的:大肠杆菌中分泌表达重组蛋白受限于其分泌效率,为此设计构建大肠杆菌诱导裂解系统以实现胞内重组蛋白的快速高效分泌。方法:利用大肠菌素E7对细胞的裂解能力,构建共表达