论文部分内容阅读
自然场景视频中含有各种类别的视频基元(video primitives),它们构成了整个高维视频块(video bricks)空间,具有不同的结构维度及复杂度,由空间表观与运动共同描述.视频基元主要有两类:结构视频基元与纹理视频基元.文中使用一个通用生成式模型对两类视频基元进行统一概率建模,每个视频基元的表达能力由其对应的信息增益来度量.利用该度量进行视频基元追踪学习,最终建立一个完整的视频基元集.实验结果显示了文中方法在视频内容表示方面的有效性.