论文部分内容阅读
视频分割是视频结构化组织的基础 .提出一种结合音频和视觉信息的视频分割新方法 ,即先对视频作基于边变化率的初步分割 ,然后提取音频的MFCC及其差分系数特征 ,利用广义似然比 (GLR)距离对音频信息进行相似性比较 ,并检测相应的音频变化点 .在此基础上 ,应用音频分割点对初步的视频分割进行验证 ,获得具有一定语义内容的视频段 .实验结果表明 ,方法简单有效 ,与单一的基于视觉信息的分割方法相比 ,获得的视频片段语义信息更为完整 ,同时也避免了分割的过度细碎