论文部分内容阅读
多视频摘要在理论和技术上都面临重大挑战:相对于单视频而言,它的主题更加分散,而相对于多文档而言,它又具有多形态的特点。本文提出了一种通过分析视频集中的视觉与文本特征,产生一种由具有主题代表性的关键帧和关键词组成的圆形故事板的方法。该方法将圆形故事板的产生形式化为一个复杂图聚类和挖掘的问题。首先,将从视频集中提取出来的关键帧和从语音转录文本中提取出来的关键词组织成一个复杂图并聚成类。然后,在同时保证最大覆盖原始视频集信息的前提下,从聚类结果中挖掘出最能代表隐含主题的关键帧和关键词。本文还设计了一组实验来评价这种方法的有效性,结果显示本文提出的方法优于其他两种作为基线故事板的方法。