论文部分内容阅读
随着多媒体信息技术与WEB产业的飞速发展,生活中的多媒体数据呈现爆炸式增长的趋势。基于内容的视频检索因其在索引、组织数据上的优异性能,成为信息检索领域最前沿和最活跃的研究方向之一。本论文针对视频检索中的重要关键技术——视频镜头边界检测做重点研究,主要工作如下:
首先总结了现有视频镜头边界检测算法的过程和特点,对一些典型的检测方法做了比较和分析。在深入研究视频特征的基础上,分别提出了基于GA-SVM和综合特征的视频镜头边界检测算法和基于PSO-SVM和综合特征的视频镜头边界检测算法,并首次将角点特征应用于视频镜头检测领域。上述两种方法是对传统的基于支持向量机镜头检测方法的一种有效改进,很大程度上降低了人工参数和阈值对算法检测效果的影响。实验证明所提出的算法可以快速准确地找到镜头边界。
为更进一步地提高镜头边界检测算法的综合性能,本文还提出了一种基于中层特征和Tabu-SVM的视频镜头边界检测算法。该算法首次将中层特征应用于通用视频的镜头边界检测领域,通过综合提取主色特征和运动矢量中层特征,克服了传统底层特征无法满足对复杂多变的视频进行自动检测需要的缺陷,对视频内容的描述更加贴近于人类的认知习惯;此外,禁忌搜索算法的使用改善了传统支持向量机分类模型易陷入局部最优的缺点,能够保证得到全局最优的分类器。在Trec标准视频数据集上的大量实验结果证明所提出的算法在同类算法中处于较好的检测水平,且有效地解决了长渐变镜头容易漏检的问题。