论文部分内容阅读
稀疏表示是为了解决自然信号中的大量冗余提出的算法,作为处理高维数据的一种有效方式,应用于图像分类,图像重构等方面。而字典学习是实现稀疏表示的有效方法,字典学习通过采用尽量少的数据,学习到代表整个训练集的字典,从而应用于人体动作识别。本文通过L2,1正则化,在原子层面,加强稀疏性表示;在此基础上采用类特定字典和共享字典相结合的方式提高字典层面的稀疏性和鲁棒性;针对视频中语义信息,通过卷积神经网络(CNN)实现语义特征提取,实现了人体动作语义的语义分类;实验证实了方法的有效性。(1)提出了基于L2,1范数的原子选择方式,并将该方法应用于图像压缩采样中。针对原子的选择规则难以确定的问题,提出了基于L2,1范数的原子选择方式。以图像块为处理单位,采用L2,1范数选择有效剔除图像块内无用原子,增强块特征的判别性;兼顾了图像块间的相关关系,即某个原子在某一图像块判定是无用的,则该原子在所有的图像块上都是无用的,回避了图像块间特征选择的不稳定性,提高了重构的准确率和效率。(2)提出在张量RPCA预处理视频基础上,采用类特定字典和共享字典相结合的方式,并用于人体动作识别。首先,对于识别运动目标,因为人体动作识别中背景复杂,影响识别效果,因此,采用张量RPCA方法将视频中的背景移除,提取出视频前景,从而消除复杂背景的干扰。其次,采用类特定字典和共享字典相结合的方式对视频前景进行训练,形成代表动作类的字典。最后,通过在UCF sports、UCF50、HMDB51数据库进行实验。实验结果证实了分类效果得到提高,本文设计字典方法的有效。(3)提出结合卷积神经网络(CNN)和核字典学习的人体动作语义识别。首先利用卷积神经网络(CNN)对关键帧进行卷积处理,突出图像的语义特征,并通过池化层降维。其次,构造语义核字典在无遮挡与有遮挡情况下的人体动作语义分类。最后,通过在UCF sports、UCF50、HMDB51数据库进行实验,实验结果证实提高了分类效果,降低分类时间。