论文部分内容阅读
近年来,随着Internet技术发展日新月异,视频数据日益丰富。传统的视频检索技术得到的检索结果已无法满足用户需求,于是提出了视频语义分析研究。视频底层特征与高层语义理解之间存在难以跨越的鸿沟,如何从视频数据中提炼出易于理解的高层语义概念,仍然是视频语义分析研究中一个亟需解决的问题。 本文首先概述视频语义分析的研究背景及应用领域;然后概括了课题研究现状;最后简述视频语义分析研究过程中的预处理部分,即视频镜头分割、关键帧提取、特征提取、特征融合。综观目前视频语义分析的研究进展,本文提出了基于局部敏感可鉴别的视频特征稀疏表示方法、基于局部敏感可鉴别稀疏表示的加权KNN视频语义分类方法、基于上述算法的视频语义分析和原型系统开发,具体内容如下所述: (1)提出了基于局部敏感可鉴别的视频特征稀疏表示算法。在基于稀疏表示的视频语义分析中,考察相同类别的视频数据样本能产生相似的稀疏表示,即两个来自相同类别的视频特征的稀疏表示系数相似,从而有利于提高视频特征稀疏表示的可鉴别性。在局部敏感稀疏表示方法中引入基于稀疏系数的鉴别损失函数,优化构建用于稀疏表示的字典,使视频稀疏表示特征满足Fisher准则,建立可鉴别模型。实验结果表明本文所提算法显著提高了视频特征稀疏表示的可鉴别性,与其他方法相比有效提高视频语义分析的准确性。 (2)提出了基于局部敏感可鉴别稀疏表示的加权KNN视频语义分类算法。基于稀疏系数的重构误差分类方法没有充分考虑数据样本之间的可鉴别性,因此影响视频语义概念分类的效果。本文所提分类方法结合稀疏表示重构误差和类别鉴别性作为样本类别鉴别的损失函数,根据样本与各类别训练样本的损失函数值进行投票统计,并采用各类别的权重系数修正投票统计结果,检测样本的语义概念。实验结果表明该方法显著提高了视频语义分类的准确率,缩短了语义分类时间。 (3)设计开发了基于局部敏感的可鉴别稀疏表示的视频语义分析原型系统。采用面向对象的设计思想,通过MATLAB和VC++的混合编程,实现了关键帧提取、特征提取、特征融合、字典学习、稀疏表示、视频语义分类六大模块,设计了用户友好界面,通过实验进一步验证本文所提算法的有效性。