论文部分内容阅读
自上世纪九十年代以来,多媒体信息迅速膨胀,基于内容的视频检索成为了研究的热门课题。其中,如何利用机器学习理论使计算机能自动获取视频中的语义信息,以便有效地进行视频语义检索,是当今多媒体研究领域中一个亟待解决的问题。因此,如何进行有效的视频语义标注是本文研究的目的。目前已有的视频语义标注方法多是基于统计学理论,采用全监督学习方法进行语义标注工作。这种方法需足够多的已标记样本进行学习,从而建立分类器用以标记未知样本。众所周知,获取大量已标记样本是一项费时费力的工作,而获取大量未标记样本却是一项非常容易的工作。如此,通过对少量已标记样本和大量未标记的样本进行学习从而建立分类器的半监督学习方法应运而生。若其最终的学习效果与全监督学习方法的效果一致或接近,则在人工成本和实现上,半监督学习方法更具有优越性。如何利用未标记的视频样本信息达到类似于全监督学习的效果是半监督学习方法的关键。本文讨论了利用半监督学习方法进行视频语义标注的问题。文中采用统计学理论,利用贝叶斯概率公式计算视频语义出现的概率,选取概率最大的类别标注未标记的样本。在计算的过程中,使用了未标记样本的信息计算语义出现的后验概率。通过在贝叶斯概率公式中添加未标记样本信息的影响因子,利用未标记的视频样本信息,将半监督学习的方法引入视频语义标注的工作中,综合利用已标记和未标记的样本信息进行语义概率计算。核密度估计方法从数据样本本身出发研究数据分布特征,不利用有关数据分布的先验知识,避免了模型估计和参数估计的主观影响。为了使标注的视频语义更准确、有效,达到本文研究的目的,本文采用的半监督学习方法基于高斯核函数,结合半监督学习和核密度估计方法的优越性,采用最优的未标记样本信息参数影响因子对未标记的视频进行语义标注。文中针对该标注方法设计了语义标注性能分析系统,研究本文采用的方法的性能。结果表明:本文讨论的这种半监督学习方法可获得近似或等于全监督学习方法的结果,减少了人工工作,能提高视频语义标注性能,有利于大规模视频语义标注。