论文部分内容阅读
随着多媒体和网络技术的飞速发展,产生了海量的视频数据。为了使用户能够快速准确地检索到感兴趣的视频信息,需要对这些数据进行有效地组织、管理和分析。其中,通过视频分类技术对视频数据进行语义类别的整理分类,能够缩小检索范围,提高检索速度。
视频分类可以分为基于关键词的视频分类和基于内容的视频分类。通过人工标注的关键词对视频进行分类,不仅受入主观因素的影响,标注的关键词主观性强,而且随着日益增长的视频数据量,人工标注费时费力。基于内容的视频分类根据视频的视觉、音频等内容对视频进行自动分类,由于视觉、音频特征客观地描述了视频的真实内容,因此克服了基于关键词分类产生的问题。
目前视频内容分析技术主要是利用视频低层特征描述其内容,与人们对视频语义内容的理解存在很大差异,因此基于内容的视频分类存在的问题是视频低层特征和高级语义概念之间的语义鸿沟。本文在分析现有基于内容的视频分类算法的基础上,采用数据挖掘技术,对基于内容的视频分类若干关键技术进行了研究,力图挖掘视频的类别语义信息,以克服现有的语义鸿沟问题。本文主要工作包括:视频镜头边缘检测和关键帧提取、视频特征提取和视频镜头分类等。具体内容包括以下几个方面:
(1)视频镜头分割部分,提出了一种基于因果的自适应双阈值镜头边界检测算法,并对突变检测和渐变检测方法进行了改进,取得了较好的检测效果,最后在镜头分割的基础上进行了关键帧提取;
(2)通过分析卡通、新闻、电影、篮球和足球五类视频在视觉特征上的差异,完成了基于关键帧和镜头的颜色和运动视觉特征的提取,并对特征数据进行整理,实现了一套视频镜头描述方案,取得了较好的视频镜头内容表达效果;
(3)在视觉特征提取和视频镜头描述基础上,采用Microsoft决策树分类算法构建视频镜头分类模型,对视频镜头进行高级语义的视频类型分类,取得了较好的分类性能。
本文所提的视频分类方法可以进一步推广到视频检索、视频内容过滤、智能化电视等各种应用中,并会推动新的视频应用的发展。