基于RGB-D与深度学习的人体行为识别算法研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:grchenpk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别算法在虚拟现实、智能监控和无人驾驶产业蕴含着巨大的研究意义和工业价值。传统行为识别算法都是基于彩色图,手工设计特征提取器,提取彩色图的形状颜色等特征,然后对特征建立描述符,选择分类器进行分类。这会导致两个问题,第一,彩色图信息熵较少,提取的特征不能很好的表示行为并且对背景遮挡和视角变化的泛化性很差。第二,传统算法特征提取器设计困难,而且其行为识别率不高。而新兴的RGB-D数据包括彩色图,深度图和骨骼图,含有丰富的信息熵,但RGB-D多源信息融合是一个难点。此外,实验证明卷积神经网络在图像分类上取得了巨大的成功,因此,本文提出基于RGB-D与深度学习的人体行为识别算法。为解决传统算法特征提取器设计困难的问题,采用Faster RCNN来提取特征并分类,分析了Faster RCNN的算法框架,通过数据增强、删除一层全连接层和加入Dropout等策略,来提高人体行为识别率。针对RGB-D多源信息融合困难的问题,利用RGB-D信息之间的互补性,使用深度图和骨骼图,定位彩色图的感兴趣区域,排除无关区域的干扰。综上,提出基于RGB-D与Faster RCNN的人体行为识别优化算法,并在UTKinect数据集进行实验,实验结果显示,算法的平均识别率达到了94.70%,优于其它主流算法,验证了算法的可行性。为解决彩色图信息熵较少和在背景遮挡与视角变化场景下泛化性差的问题,利用深度图和骨骼图对背景遮挡和视角变化有较强鲁棒性的数据特点,采用Two Stream CNN来融合深度图和骨骼图的特征。并在网络内部提出两种融合策略,分别在全连接层和Softmax层融合,以研究不同的多源信息融合策略对行为识别的影响。两种不同的融合策略,在UTKinect数据集上的平均识别率分别为96.20%和95.70%,在SBU Kinect数据集上的平均识别率分别为92.70%和92.10%,都优于其他主流算法,有效验证了算法的鲁棒性。
其他文献
<正>本信息网提供如下服务内容一、"试剂与精细化学品经济技术信息网"是由全国化学试剂信息站于1987年7月创办,本网每月荟萃、编辑、印发一册信息资料,作为本站与化学试剂行
目的探讨西格列汀联合胰岛素对2型糖尿病(T2DM)控制效果及对血浆血管内皮生长因子(VEGF)、转化生长因子β1(TGF-β1)和C1q/TNF相关蛋白3(CTRP3)表达的影响。方法选取2016年5月—2017
<正> 箜篌是我国的一种古代乐器,初名“坎候”,又名“空候”,后写为“箜篌”。《史记·封禅书》云:“其者,既灭南越,上有嬖臣李延年以好音见。上善之,下公卿议,曰:‘民间祠尚
随着我国高铁运输业的飞速发展,列车运行速度大幅提高,传统测速方法存在的缺点无法满足高速列车的精确测速,多普勒雷达测速传感器应运而生。它主要基于多普勒原理,利用DSP对采集
进入20世纪下半叶,整个世界在政治、经济、文化、教育、科技等各个领域风起云涌,世界格局和面貌发生了巨大变化。在中国,上个世纪80年代末,党中央吹响了改革开放,建设中国特色社会
二氧化碳是温室效应的主要来源,因此降低二氧化碳的排放、开发利用二氧化碳已成为当务之急。过去几十年里,二氧化碳与环氧化合物共聚制备聚碳酸酯在二氧化碳综合利用研究领域
设备的故障诊断技术有温度检测、油样分析、无损检测以及振动检测技术等,某化工厂根据自身的实际情况选择振动检测技术,并通过选用BH550和SB770对一台多级离心给水泵进行故障
30多年来的政治、经济体制改革带来了利益格局的改变,利益格局的变化导致阶层的分化,贫富阶层间的利益矛盾冲突不断显化与深化。本文围绕"利益妥协"和"阶层合作"探讨利益妥协
现实主义绘画在当今画坛再掀波澜,本文从现实主义绘画的时代意义出发,指出当今美术创作中精神探索的必要性问题,同时从历史及现实的双重缘由考虑,点出现实主义绘画的时代性和现实