光照和遮挡条件下基于深度学习的行为识别方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:x28221181
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别包含着丰富的动作信息,在人机交互、视频检索、运动合成和智能视频监控等领域有着广阔的前景。目前,行为识别主要以接近于现实情况的视频为对象,现实生活中不可避免的会受到光照和遮挡等复杂因素的影响,从而降低行为识别的正确率和鲁棒性。针对光照强度影响行为识别率的问题,引入了 HOG特征与3D-SIFT特征、D-S证据理论融合策略、Dropout和随机池化算法等思想,针对不同程度遮挡影响行为识别率的问题,引入了双向光流通道、双向RGB通道等思想。本文具体研究内容如下:(1)提出一种基于D-S证据理论的HOG与3D-SIFT多特征融合算法。针对光照不匀的问题,首先提出了改进后的gamma校正方法进行光照校正,基于传统方法的思想首先对人体行为的时空兴趣点进行提取,对三种不同提取方法进行实验对比后采用3D-Harris检测算法,进而采用具有光照不变性的HOG与3D-SIFT特征描述子对时空兴趣点分别进行特征提取,设计支持向量机并输入得到基本概率分配,结合提出的D-S证据理论进行融合与识别。相对于主流的DT与IDT传统人体行为识别方法识别率分别提高了 0.83%与6.83%。实验结果表明,在数据集UCF101中该算法能够提升行为识别的光照鲁棒性。(2)提出一种基于Dropout和随机池化的Pseudo-3D残差网络行为识别模型。针对光照变化下传统方法无法对像素点明暗程度进行优化的问题,在深度学习基础上引入了改进的池化算法。训练阶段在Pseudo-3D残差网络池化层使用Dropout方法,随机抑制池化层单元值,使得池化层上生成更多子模型,测试阶段采用改进池化方法得到一个所有子模型的近似模型。此方法增加了不同光照下的训练特征,有效地抑制低频信息提取过多的问题,提高了测试的准确率。改进后的P3D Resnet方法在低光照强度下,相对于CNN方法,精确度高10.21%,相对于3D-CNN方法,精确度高7.19%;在正常光照强度下,相对于CNN方法,精确度高13.19%,相对于3D-CNN方法,精确度高2.80%;在高光照强度下,相对于CNN方法,精确度高12.97%,相对于3D-CNN方法,精确度高9.67%。实验结果表明,在数据集UCF101中该模型能够提升行为识别的光照鲁棒性与准确率。(3)提出一种结合LSTM的双流卷积神经网络模型。针对人体行为局部遮挡导致识别率差的问题,引入了双向光流通道和双向RGB通道结合的思想,以双流模型为基础在RGB通道的全连接层接入双向长短时记忆网络,充分利用前后时间信息并结合softmax分类器得到分类结果。我们的算法相比于C3D、普通双流网络的识别准确率分别高出2.4%、3.1%。实验结果表明,在数据集UCF101中该算法能够更好地识别前后时序信息、关注有用信息,提高行为识别对于遮挡条件的鲁棒性。
其他文献
学位
随着科学技术的进步,远程医疗技术飞速发展,病人的隐私信息和医疗信息一起在互联网上传播,带来便利的同时也使得病人信息安全面临巨大挑战。近年来,为了保护病人隐私,信息隐藏技术被广泛应用于医学图像中。医学图像作为医生诊断患者病情的重要依据,图像病灶区的微小改变都有可能对医生的诊断造成干扰,因此信息隐藏不能对此产生任何影响,同时,还要求在保证图像质量的前提下提高嵌入容量。本文以信息隐藏技术在医学通信中的应
学位
学位
美国通俗小说作家斯蒂芬·金出道至今已五十年有余,他因为《丽塔·海华丝与肖申克的救赎》、《魔女卡丽》、《闪灵》等一众代表作为全世界的人们所熟知。金的作品数量庞大,风格多变,我们很难用寥寥数语概括出斯蒂芬·金小说的共同特质。然而,确有这么一种主题贯穿了金的大部分小说,那便是“自由”。西方世界的思想家与政治家们已经为自由的理想奋斗千年,这一过程中人们进入了物质文明高度发达的时代,可人人都能平等生存、自由
学位
学位
学位
随着管道运输行业的不断发展,管道泄露事件的频发,不仅给人类自身财产及安全带来了严重的破坏,还对如今的自然环境带来了严重的污染,管道的安全运行日益成为企业与政府关注的问题,以往管道所处的环境较为复杂,而设备的运行也无法全面的了解,通过传统定性及半定性风险评价方法与管道过去多年来总结的专家经验对管道风险进行预测分析是不够全面的。随着传感器技术的不断发展进步,我们可以更加便捷的获取设备的历史运行数据。机
学位
学位
学位
学位