基于深度学习的人体行为识别

来源 :重庆大学 | 被引量 : 0次 | 上传用户:alivealive
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频获取技术和互联网的飞速发展,视频迅速成为人们日常生活中信息来源的重要载体。视频数据量正处在指数级的增长状态,巨量的视频在丰富日常生活的同时,也带来了诸多难题,比如视频在检索和人体行为分类等方面都存在不小的难度。视频的人体行为识别已经成为一个研究热点,本文针对该课题进行研究,首先从视频数据中提取出能有效表达人体行为的特征,然后充分融合视频的长短时间信息,最后搭建起卷积神经网络,实现视频中的人体行为识别。论文的主要工作如下:  ① 针对视频相对于图像来说多出时间维度这一特点,采用视频长短时间信息融合的方法提取视频的有效特征。通常卷积神经网络是处理单帧图像,面对含有时间信息的视频,本文先利用光流算法得到包含视频短时信息的光流特征。为了短时时间信息更加鲁棒,将多帧光流特征叠加作为卷积神经网络的输入;为了得到视频的长时时间信息,将视频均分多段并把每段的光流特征输入网络,把网络输出结果再做融合。最后实验表明利用视频长短时间信息能提高行为识别的准确率。  ② 针对视频片段静止时光流算法无法提取到有效特征等问题,提出采用鲁棒主成分分析算法提取视频稀疏、低秩特征然后结合神经网络进行行为识别。将视频数据看成一个整体,由稀疏成分和低秩成分组成,低秩成分表征视频的背景,稀疏成分能有力描述视频中人体行为。该算法能够从复杂的视频中分离出低秩背景特征和稀疏前景特征,这两种特征都是由像素级别组成,能有效表征人体行为特征,并且有着很好地鲁棒性。  ③ 近几年深度学习飞速发展,涌现了一大批优秀的网络,比如AlexNet、VGG、Inception-bn、ResNet 等。在实验过程中,发现训练不同的网络得到不同的行为识别准确率,在这几类网络中残差网络具有最好的特征提取能力。针对采用何种卷积神经网络搭建模型的问题,本文搭建了稀疏流和低秩流的双流网络,稀疏特征和低秩特征经过残差网络之后经过融合再送入分类器,最后实验分析验证了残差双流网络提高识别的准确率。
其他文献
随着移动计算时代的到来,嵌入式操作系统对移动数据库系统的需求为数据库技术开辟了新的发展空间。嵌入式数据库技术目前已经从研究领域逐步走向了广泛的应用领域。嵌入式Int
随着全球经济的不断发展,石油作为最主要的能源,其战略地位越来越重要,全面提高石油勘探技术,增加石油储量已经成为世界各国的当务之急。地震勘探检波器是石油地震勘探工作的首要
体可视化是科学可视化的一个重要分支,它研究体数据的可视化问题,是人们理解和洞察体数据最有效手段.近年来,体可视化得到了飞速的发展,并取得了不少成就,不过它仍处于发展阶
该文通过对战斗机研制经费及其分布规律的研究,找到了一种科学、有效和实用的研制经费需求预测方法.采用工程法对战斗机的研制经费进行了分析研究,建立了研制费用估算模型;以
该文就奇异混合造型技术方法进行了系统的研究,其目的在于探索新的曲线曲面设计方法和理论,丰富CAGD的内容和方法,拓展CAGD研究的领域,从而为计算机辅助设计与制造技术提供设
随着我国自主设计大型商用飞机的项目工作全面展开,大型客机总体设计技术越来越受到重视。优化方法应用于客机概念设计能有效提高客机总体设计能力。本文应用优化软件iSIGHT二
在对现代航空发动机转子系统的临界转速影响因素进行了详细的分析后,选取了设计变量的类型;首次引入了模糊数学的隶属函数的方法对临界转速相对于常用工作转速点的分布形态进
空气预热器的漏风问题严重影响着机组运行的安全性和经济性,是目前锅炉运行中亟待解决的重要问题之一。目前仍缺乏空预器漏风的有效检测方法,往往由运行人员根据经验来判断空预
随机有限元法作为随机分析理论与有限元法结合的产物,被视为计算结构力学的发展趋势之一.该文讨论了随机的有限元法的几类主要算法及结合随机有限元法进行结构可靠性分析的方
固体推进剂通过燃烧释放能量,因此燃烧机理的研究对于固体推进剂的应用有着重要意义.RDX-CMDB推进剂是近年来国内外推崇的低特征信号推进剂.该文主要针对这种推进剂的燃烧机