基于卷积神经网络的人体动作识别技术研究

来源 :成都信息工程大学 | 被引量 : 1次 | 上传用户:XPTRY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别在智能视频监控、基于视频的内容分析与检索、人机智能交互、虚拟现实以及医疗看护等领域中有着广泛的现实应用前景。人体动作识别技术是计算机对视频或者图像序列中的动作行为提取出具有辨别能力的特征进行动作分类识别的技术。卷积神经网络(Convolutional Neural Network,CNN)是一种仿生神经网络,通过利用分层非线性变换无监督地从低层特征中自动学习高层特征来实现数据的高层抽象,解决了动作识别任务中特征的提取对任务本身的依赖,和传统的人工定义特征手工提取特征的动作识别方法截然不同。本文重点研究构建不同的人体动作识别模型,使其不但能从背景中检测出运动目标,而且对动作的多样性变化(如同一个动作在不同场景下的差异表达或者是不同个体对同一个动作表达的姿态差异以及动作的部分遮挡等)具有鲁棒性。本文主要完成了以下几个方面的研究工作:(1)在Bag-of-feature词袋中心选择的K均值(K-Means)聚类算法中加入轮盘赌算法进行改进。提取Harris-Laplace时空兴趣点及3D-SIFT(Scale Invariant Feature Transform)描述子,通过Bag-of-feature构建词袋,利用改进的K均值算法进行聚类,最后进行多分类支持向量机(Support Vector Machine,SVM)人体动作分类识别。对基于时空兴趣点的传统人体动作识别方法中的聚类算法加入轮盘赌算法进行改进,使得类簇之间比较分散,实现提高动作识别的准确率。(2)将ImageNet图像分类任务中的批归一化(Batch Normalization)思想应用到动作识别领域。构建批归一化与GoogLeNet网络相结合的网络结构。将卷积神经网络训练中的卷积层输出特征数据进行批归一化算法处理操作,再输入到下一层网络中。相对于传统的卷积神经网络在训练算法以及网络结构两个方面进行改进,从而提高动作识别准确率。(3)利用上述改进后的卷积神经网络结构构建时空网络。空间网络通过视频帧的RGB图像来获取运动的外观信息而时间网络则是通过连续帧间的光流场来捕获运动信息,最后将时空网络融合,这样既考虑到外观信息又关注到运动信息,实现提高动作识别准确率的目的。(4)针对动作视频的时序性,构建一个26层的三维卷积神经网络模型。将传统的卷积神经网络中的二维卷积拓展成三维卷积,直接对输入的视频数据或者图像序列进行三维卷积操作,提取连续多个动作视频帧的时空运动信息。
其他文献
3月9日,武汉市召开2018年招商引资大会,省委副书记、武汉市委书记陈一新强调,要深入学习贯彻习近平新时代中国特色社会主义思想和党的十九大精神,按照省委、省政府部署,以新发展理
报纸
职业精神在高职学生职业素质中占有重要地位。培养学生的职业精神的最有效途径是校企合作。要注重顶岗实习期间对学生灌输优秀的企业文化,在优秀企业的真实环境中培养学生良
平阳民间木板年画有漫长历史发展演变过程,沿袭中国传统文化的基本精神,丰富了华夏文明。反映了群众的文化习俗,满足了人们的愿望和审美趣味,它成为不可或缺的精神文化食粮。
目的分析社区康复疗法在稳定期慢性阻塞性肺疾病患者健康管理中的应用价值。方法选取2016年1月至2017年9月本院收治急性发作期住院控制后慢性阻塞性肺疾病患者112例为研究对
目的观察分析中药自拟方联合右佐匹克隆片治疗帕金森病失眠的临床疗效。方法以本院30例帕金森病失眠患者为研究对象,根据随机数字表法分为观察组(15例,给予中药自拟方+右佐匹
<正>随着社会对英语的要求越来越高,农村小学也纷纷开设了英语课程。随着课程改革的实施,农村小学的英语教学取得了长足的发展,但与城市相比,依然存在很多问题。面对农村小学
目的研究急性脑梗死的超早期溶栓治疗效果。方法选取本院在2016年1月至2018年11月收治的ACI患者68例,依照患者入院顺序的先后,将患者均分为两组,即A组与B组(各34例),A组患者
以风力发电及海水淡化一体化平台为研究对象,对平台进行概念及总体设计。利用水动力软件AQWA,在频域内进行分析,得到了一体化平台的水动力参数以及各参数在不同入射角下的变
数学语言素养是引导学生开展数学活动的重要内容,在数学教学中有着特殊的地位和价值。随着素质教育的不断发展,对学生进行数学语言的培养成了每位数学教师的责任,因此,教师在