论文部分内容阅读
近几年,基于内容的体育视频分析越来越受到人们的关注,研究者在结构化分析和语义检测方面展开了大量的工作,但是这些工作有一个很大的局限性:引入太多的领域知识,通常只能在一种或少数几种体育视频里应用,难以有效扩展。本文在现有研究成果的基础上提出了更通用的体育视频分析方法,包括体育视频的镜头分类方法,体育类型分类方法以及语义事件检测方法。这些方法可以同时针对网络视频进行有效应用。具体来说,本文的贡献可以总结为以下几点:
1.提出了一种基于局部不变特征的体育视频镜头分类方法,它几乎没有引入任何领域知识。因此,与以前的方法相比,具有更好的通用性。本文采用该方法对10类体育视频进行了镜头分类实验,平均正确率都在75%至95%之间,充分证明了本文方法的有效性。
2.提出了一种基于码表(codebook)的层级体育类型分类方法。以前的体育类型分类方法由于缺乏扩展性,通常只能处理3-6类体育视频,使用本文的分类方法对14种体育视频进行分类,平均正确率将近85%。因此,与传统方法相比,本文的分类方法具有更强的扩展性。
3.提出了基于隐条件随机场(Hidden Conditional Random Fields,HCRFs)模型的两阶段事件检测方法。本文使用该方法对篮球比赛中的多种进球事件进行检测,与使用传统的隐马尔可夫模型(Hidden Markov Model,HMM)以及条件随机场模型(Conditional Random Fields,CRFs)方法相比,性能提高超过5%。
4.网络视频越来越丰富,但受带宽和存储空间所限,网络视频质量通常都不高。因此,对网络视频进行结构化分析与语义检测非常具有挑战性。本文的实验数据几乎都来自网络,实验结果可以充分证明本文的方法可以有效应用于网络体育视频。