基于手势与物体的操作行为识别

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:jwh346048162
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会的发展使得互联网与多媒体技术走向了新的高度,给我们的生活带来了大量的音视频数据,人们越来越期望能够利用计算机来感知理解这些图像或视频中人类的行为,由此引出了行为识别技术。作为计算机视觉领域的前沿技术之一,行为识别技术吸引了广大科研工作进行广泛而深入的研究与探索,在智能家居、视频监控以及机器人学习等多个应用领域有广阔的发展前景。针对动态复杂场景下的操作行为识别,本文提出了一种基于手势与物体的操作行为识别框架。该框架主要包含RGB视频特征提取模块、手势特征提取模块、物体特征提取模块与动作分类模块四个部分。其中RGB视频特征提取模块主要使用了I3D网络来获取RGB视频的时间与空间特征;手势特征提取模块利用Mask R-CNN网络提取出操作者手势特征(抓取类型);物体特征提取模块使用Mask R-CNN网络提取出被操纵物体特征(物体属性);动作分类组件将上述特征进行融合,并将融合后的特征输入到分类器中进行识别行为。本文在一个名为EPIC-Kitchens的大型的公开行为数据集上进行了实验验证,实验结果表明,本文提出的方法框架能够较好地识别分类出视频中的手部操作行为,验证了手势与物体特征对操作行为识别的可用性与有效性。
其他文献
随着5G和人工智能技术的不断崛起,人机交互方式的不断完善,越来越多的研究者开始从事于人工智能、自动驾驶以及人机交互领域。手势作为人机交互中最常见的沟通方式,逐渐成为
多标签的图像分类问题是计算机视觉与模式识别领域一个重要的课题。由于在现实世界中,诸如图像、视频、音乐、文档等对象通常均由多标签的属性描述,相比于与单标签的图像分类
闭合序列模式挖掘已经成为序列模式挖掘重要研究方向之一并且在诸多领域具有广泛应用。许多研究表明闭合模式集是频繁模式集的无损压缩表示,同时保留了频繁模式集中所有有用
目前我国《铁路工程抗震设计规范GB 50111-2006》在超过120m的预应力混凝土桥梁抗震设计方面的规定和一般的中、小跨径桥梁是不同的,前者并没有给出明确的设计规范,但是铁路大跨径桥梁的地震响应情况又很复杂,其规律更难以掌握,因此,有必要对大跨桥梁的地震响应情况进行研究。文章采用有限元分析软件Midas Civil 2015对郑州至周口至阜阳(45+75+172+75+45)m曲弦钢桁架加劲连
本文分别设计合成了多种遥爪型和半遥爪型聚合物,将这些聚合物用作成孔剂制备了多种介孔二氧化硅材料和介孔碳材料。主要研究内容有以下几个方面:1.半遥爪型和遥爪型聚苯乙烯均聚物为成孔剂制备介孔二氧化硅材料的研究。通过原子自由基聚合(ATRP)、亲核取代、Huisgen环加成反应等反应制备了半遥爪型和遥爪型的聚苯乙烯均聚物,采用核磁共振氢谱(1H NMR)、凝胶渗透色谱(GPC)和傅里叶变换红外光谱(FI
目前很多僵尸网络上的恶意代码通过匿名访问实施攻击,让广大网民面临着病毒侵扰、数据安全和日益复杂的恶意代码带来的威胁。僵尸网络上有着病毒、蠕虫、木马等多种恶意行为,
随着城市轨道交通的快速发展,呼和浩特市区也开始了轨道交通1、2号线的建设,其中,大型换乘车站新华广场站、2号线大学西街站和中山路站均采用盖挖逆作法施工,设计时,梁、柱节点的设计作为一大难点需具体研究。采用逆作法施工时,结构交汇于同一节点的各构件,并不是同步完成的,钢管混凝土柱与后浇梁连接处的节点承担着至关重要的作用,为了满足节点抗剪能力,设计时采用了一种新型的双牛腿节点,本文对该种新型节点结构与传
果园经济作物的种植面积较大,传统的采用人工对果园喷雾施药的方式存在着效率低、劳动强度高、易中毒等问题,为了提高果园喷雾作业效率,减少劳动力成本,减少药液对劳动人员的
作为联结理论与实际的桥梁,教育实习对于职前教师发展意义重大。然而,短期内由学生身份向教师身份的跨越并非易事,教育实习往往是引起职前教师焦虑的重要来源之一。其次,不同
设备直连(Device-to-Device,D2D)通信是应急场景通信的关键技术之一。但由于D2D通信设备能量受限,无法满足较长时间、数据量大的传输需求,而且应急场景下通信环境极其复杂,严