论文部分内容阅读
提出了一种基于视音频特征和文本信息的新的场景自动分割技术。其基本思想是先探测新闻视频的镜头边界,再用文本检测方法识别主题字幕帧以得到分割信息。用短时能量和短时平均零交叉率参数探测静音分片。将视音频特征和文本信息相结合以实现自动场景分割。实验使用135 400 帧的测试数据达到了85.8%的准确率和97.5%的重现率。实验结果表明此方法是有效的、稳健的。