论文部分内容阅读
近年来随着互联网技术和计算机视觉的快速发展,人体行为识别领域受到了广泛关注。人体行为识别技术在增强现实、智能安防、自动驾驶汽车等领域有着广阔的应用前景,所以本文以人体行为识别为研究内容展开。 随着深度学习的提出,人体行为识别的研究发展迅速。由于人体行为视频数据存在运动场景复杂,视频质量参差不齐,运动行为存在大量噪声等问题,现有提出的人体行为识别技术还不能有效的对其进行分析与识别。人体行为识别技术核心的过程为:运动行为的特征提取、动作行为的识别与分类。传统的特征提取方法利用专家先验知识提取特征,具体采用无监督的方式从视频数据中抽取特征描述子,但是传统方法提取的特征描述子并不能全面的刻画整个运动规律。而深度学习则模拟人脑学习过程,通过神经元相互连接构建端对端的模型,有监督自适应的从视频数据中提取特征并同时进行识别与分类,虽然深度学习提取的抽象特征具有很强的判别力,但是其网络结构复杂,模型计算代价巨大,而且会产生大量冗余计算。所以本文主要研究结合传统特征提取方法和深度学习各自的优势进行特征提取与行为分类。主要成果如下: 1.提出一种基于轨迹和卷积神经网络的人体行为识别方法。该方法通过利用卷积神经网络对人体行为视频有监督特征提取的优势与特点,又结合传统专家知识和计算机视觉先验知识,从而提出使用轨迹约束卷积层特征的方法进行人体行为识别,该方法不仅利用了卷积神经网络强大的特征提取能力,在此基础上又利用传统专家知识强化特征学习过程,进一步增强了特征的判别力和鲁棒性。 2.提出基于局部栈式费舍尔特征提取的人体行为识别方法。传统费舍尔向量编码方法只能提取样本特征空间的全局信息,而人体行为视频样本的时空域同时存在全局结构信息和局部运动信息。所以我们在传统费舍尔向量编码基础上提出一种局部栈式费舍尔特征提取方法,该方法可以抽取兼顾局部和全局信息的特征,能够更加准确的描述运动过程,提高人体行为动作的识别能力。 3.提出了一种基于深度全连接神经网络的人体行为识别方法。由于人体行为视频数据存在小样本、高特征维度、运动信息稀疏等特性,现有分类模型很难学习到一个超平面对人体行为视频样本进行识别与分类。而我们提出的深度全连接神经网络模型,通过学习到一个具有强特征组合能力的深度网络模型,可以利用线性和非线性组合抽取大量高阶抽象特征,进而提升人体行为识别的性能。 本论文的工作得到了国家自然科学基金(No.61272282)和“十三五”预研领域基金(61404520101)项目的资助。