论文部分内容阅读
基于内容的视频检索是当前多媒体领域的研究热点。镜头分类,是基于内容的视频检索的基础工作。运动信息是描述视频的一种重要信息,是视频所独有的特征。运动信息有两种,全局运动和局部运动。全局运动代表摄像头的运动,局部运动代表视频里的目标运动。虽然人们一般更加关心视频里的目标运动,但是摄像头的运动也包含着重要信息,也是对视频中人物或事件变化的一种反映。为了实现镜头分类,首先必须区分全局运动和局部运动。
本文根据 MPEG 编码的特点,在传统自组织映射算法 (SOM) 的基础上,提出了多层次自组织映射算法 (MSOM)。通过采用多层次的神经网络,MSOM 解决了传统 SOM 算法在有冲突的情况下,造成分类误差的问题。为了进一步提高算法的执行效率,通过引入主成分分析方法 (PCA),本文提出了基于主成分分析的多层次自组织映射算法 (MPCA-MSOM)。MPCA-MSOM 算法在保持较高识别率的同时,大大降低了计算复杂性,提高了执行效率。
仿真实验的结果表明,相对于其它同类算法,MSOM 和 MPCA-MSOM算法提高了分类的识别率,在利用运动信息的镜头分类中有更好的效果。