基于神经网络的动作识别方法的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:wusuowei282736
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,视频数据量呈爆炸性增长,应用领域更趋多样性,涉及到安全、监控和娱乐等各个领域。面对如此海量的数据,传统的人工处理已经无法满足人们的需求。因此,利用计算机强大的存储和计算能力实现对视频信息的识别和理解,具有重要的研究价值和广阔的应用前景。针对人体动作识别问题,本文首先围绕特征提取和动作分类两个关键步骤展开论述,重点介绍了广泛使用的时空兴趣点的检测和表征方法,以及常用的动作分类算法。然后,分别从特征提取和动作分类两个角度就本文提出的基于神经网络的人体动作识别方法展开详细论述:(1)传统的卷积神经网络是在二维图像上执行卷积和池化操作来进行特征提取,无法保留视频序列的时间信息,而3D卷积神经网络是在三维时空立方体上执行3D卷积和3D池化操作,可以有效地提取到视频序列的时空信息。以此为基础,本文提出了基于3D卷积神经网络的人体动作识别算法框架。(2)对于不同的视频,卷积神经网络提取到的特征数量不同,在进行动作分类时,采用监督学习的方法还需要利用这些特征对视频特征进行统一表征,而这可能会稀释动作的关键特征。因此,本文引入了多示例学习的方法去训练分类模型,以使分类器具有识别相似动作之间微小区别的能力。最后,我们训练了3D卷积神经网络,并在相应数据库上进行了实验验证和结果分析。
其他文献
我国印刷机械产业在改革中发展,在创新中前进,不断飞跃。中国印刷机械制造企业以开拓精神,锐意改革,不断创新,取得硕果累累,努力实现由”制造”到“创造”的蜕变。
文章介绍了一台SZS14-1.0/95/70-Y型双锅筒纵置式燃油锅炉改造为水煤浆流化床锅炉的成功实例,对改造后的锅炉结构和水循环方式进行简介.
目的猫白血病病毒C亚类受体(FLVCR)是胞浆血红素输出体,高水平表达于人类造血细胞。FLVCR功能丧失可导致猫红系祖细胞(CFU-E)缺乏和严重贫血。通过研究FLVCR在儿童地中海贫血
财务会计目标是财务会计理论研究的逻辑起点,同时它指导着财务会计实务并受会计环境的影响。文章通过介绍财务会计目标的基本内涵和财务会计目标理论的两大学派,阐述了企业财
阳光体育运动就是让广大青少年学生走向操场、走进大自然、走到阳光下,积极参加体育锻炼,力争用三年的时间使85%的学生按照学生体质健康标准,每天锻炼一小时,掌握至少两项体
对SZS20-1.6/350-Y(Q)产品过热器和减温器的设计原理、结构布置及计算进行了分析,并重点介绍了过热器和减温器受热面积的设计计算方法及过程.
英语教材是根据教育部门的需求所编写的,是传播英语知识的主要载体。英语教材的质量已经成为影响英语教育水平的重要因素之一。因此,对英语教材评价至关重要。《牛津高中英语
同志们:徐部长在这次会议上做了重要讲话,深刻分析了科技工作面临的形势,着重阐述了加快发展技术市场与提高我国自主创新能力和转变经济增
<正>在经济新常态背景下,生态文明理念指导下,产业成为城市发展的重要支撑和动力,而产业对城市功能的依赖也越来越强,因而"以产促城,以城兴产"实现产业功能与城市功能融合已
研究了优先扫描的强化学习方法,通过定义新的迹,把多步截断即时差分学习用于集成规划的优先扫描强化学习,用多步截断即时差分来定义扫描优先权,提出一种改进的优先扫描强化学