基于深度学习的人体行为识别技术研究

来源 :沈阳理工大学 | 被引量 : 1次 | 上传用户:liuhu1314518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子科学与信息技术的飞速发展,视频中的人体行为识别逐渐成为工业界和学术界内的比较热门的研究方向之一。人体行为识别在智能视频监控、智能医疗、安防监控、智能家居、人体智能交互等现实生活中有着广泛地应用前景和现实价值。然而由于视频中错杂纷乱的人体行为背景、人体行为的某个动作突然被遮盖和某个摄像机的视点变化等因素的影响,如何高效准确提取人体行为特征仍然是一个的巨大的挑战。针对这些问题,本课题将深度学习与目标识别两项技术作为基础,以视频中人体动作的识别为目的,来完成人体行为识别算法的研究。并在UCF101数据集上进行训练和测试,实现了基于深度学习的视频中人体行为动作的识别。本文对C3D网络结构进行改进,提出了一种基于RC3D卷积神经网络的行为识别算法,同时提取时空特征,并将三维残差网络结构嵌入到三维卷积神经网络中,在加深网络宽度的同时提高了网络的性能,避免了梯度消失问题。为了使RC3D网络学习更鲁棒的特征,有效地防止过拟合,在全连接层中引入Dropout方法。该算法在UCF101数据集上进行训练和测试,实验结果表明,基于RC3D卷积神经网络的人体行为识别的平均准确率为54.5%,比C3D卷积神经网络提高14.33%。RC3D卷积神经网络仍存在提取时间信息单一、模型泛化能力不足以及识别率比较低等问题。因此,本文在RC3D网络的三维残差网络结构中增加BN层,构成BRC3D卷积神经网络,优化了网络结构,保证每层输入数据的分布稳定性。进一步结合双流思想,构建了基于双流BRC3D卷积神经网络的行为识别算法,并采用一种加权融合策略,实现空间特征和时间特征的融合。该算法在UCF101数据集上进行训练和测试,实验结果表明,基于双流BRC3D卷积神经网络的人体行为识别的平均准确率为91.34%,该算法有效地加速了模型的训练速度,同时也提高了模型的泛化能力和识别能力。
其他文献
车路通信接入技术是新一代智能交通系统(ITS)研究的重要内容。最新商用的TD-LTE技术具有覆盖范围广、通信速率高、传输时延小等特点,特别适用于未来车路间多媒体信息传输。在
随着近年来微创外科的发展,坏死性胰腺炎的治疗方式发生了很大的变化。传统开腹坏死组织清创手术由于其并发症发生率和病死率较高,促进了内镜、影像学、腹腔镜、肾镜等微创技
稳定工作事关我国改革、发展的大局,我们党一直倡导"稳定压倒一切"的原则,要求各层面要正确看待改革、发展、稳定的关系,妥善处置稳定问题。伴随着经济建设的不断深入和改革
经过多年的室内研究及矿场试验攻关 ,大庆油田已先后成功地进行了 5个三元复合驱矿场试验。试验结果表明 ,三元复合驱可比水驱提高采收率 2 0 %以上 ,乳化对提高三元复合驱的
利用先进的车辆传感与检测技术获取车辆驾驶行为信息及车外驾驶环境信息,通过信息融合及模式识别方法对道路交通危险态势进行评估与决策,是实现机动车驾驶安全预警系统功能的
随着现代科学技术的发展及其在企业财务管理中的应用,信息化建设成为现代企业财务管理的重要手段。作为现代企业经营管理的核心所在,加强财务管理的信息化建设对提升企业的核
行政裁量作为一个在行政法的理论与实践中普遍存在的重要现象,是当今行政法学界无法回避的一个“烫手山芋”。行政裁量以其难以捉摸和难以界定的特性而成为许多年以来学术界
1研究背景中医学认为穴位是脏腑、经络之气输注于体表的特定部位,它既是脏腑生理功能、病理状态的反映,又是通过针灸可以疏通气血,调整脏腑功能的部位.穴位是经络-脏腑相关的
社区医疗体系的建设是我国医疗体制改革的重要环节之一,小病在社区解决,注重社区医疗保健作用,这对更好的发挥现有医疗体系作用、降低医疗成本极为有力。我国正处在医疗改革
当今大众的社会生活已然处于线上状态,人们的旅游生活处处需要依赖网络技术,但在线旅游企业的发展却存在很大的压力,而品牌信任是消费者购买某一企业产品的重要决定因素,因此品牌信任在各大旅游在线企业间的竞争中起着相当重要的作用,但近年来互联网的安全问题层出不穷,各大旅游在线企业的评论造假以及顾客信息泄露现象使大众对企业的信任严重下降,消费者对企业品牌的信任出现危机,旅游在线企业存活困难。旅游虚拟社区作为旅