论文部分内容阅读
随着计算机技术和互联网技术的迅猛发展,以视频记录的数据日益增多,基于视频数据的日常应用不断涌现。如何有效的管理和检索这些海量视频数据,成为亟待解决的研究课题。基于视频结构化假设的分层研究方法是解决这一问题的关键,经过十几年的研究发展,视频镜头分割技术已趋于稳定,基于视频镜头分割结果的视频场景分析将成为更具挑战性的研究热点。场景是视频的最小语义单元,因此视频场景分析技术是一种更高层次视频分析技术。同时视频场景分析技术的发展可以有效地促进基于语义的多媒体研究和应用的发展。首先,介绍了视频场景分析问题所涉及的关键技术,包括底层视觉特征,镜头分割技术和距离度量方法等。对现有视频场景分割方法进行了纵向和横向的比较分析,探讨了不同视频场景分析算法的关键和相互之间的联系。抽象出视频场景分析的一般性框架,并发掘出视频场景分析问题的可能性切入点。其次,在此基础上提出一种基于全局场景特征在视频序列中寻找频繁镜头集合,并通过局部语义特征精确定位视频场景边界的视频场景分割方法。首先对分析视频进行高精度镜头分割,选取具有代表性的镜头关键帧:然后提取各镜头关键帧的全局场景特征和局部特征,并利用局部特征聚类得到的视觉词袋对各个镜头关键帧进行语义标注;接下来计算基于全局场景特征的镜头间相似性,结合视频场景的概念和特性,在镜头关键帧序列中寻找局部频繁出现的相关性高的镜头集合,粗略定位视频场景位置;最后利用镜头关键帧的语义标注特征精确定位视频场景边界。最后,通过实验研究了基于频繁镜头集合的视频场景分割算法中不同特征和不同阶段对算法性能的影响,比较分析了在同一数据集上该算法与一种基于图割算法的场景分割算法的算法性能。