论文部分内容阅读
足球比赛持续时间长,视频数据量庞大,由于观众感兴趣的精彩事件占据比赛视频的比例较小,足球视频精彩事件自动检测便成为视频语义分析领域研究的热点和难点。目前常用的事件检测方法主要包括两大类:一类是基于机器学习的方法,另一类是基于人工规则的方法。其中,采用基于机器学习的方法检测语义事件,模型构建复杂,对训练样本数据的典型性和充分性要求较高;基于人工规则的方法,规则建立过程比较繁琐,人力耗费较大,且事件检测性能不高。因此,如何构建性能良好的语义事件模型、建立简单有效的语义规则、准确且全面地检测语义事件是目前体育视频检索领域研究的难点。本文针对足球视频精彩事件,提出了两种事件检测方法。(1)基于HMM(HiddenMarkovModel)的足球视频角球事件检测方法。通过分析足球视频角球事件的语义结构,定义并提取了六种多模态语义线索来描述镜头序列,组成观察值向量,作为HMM模型输入,经过模型迭代训练和模型参数不断优化,构建出角球事件的HMM模型,从音/视频两方面深入挖掘了角球事件的内在规律,准确实现了角球事件自动检测。实验表明,该方法检测角球事件性能良好,查全率达到了89.66%,查准率达到了96.30%。(2)基于多模态语义线索和HCRF模型(HiddenConditional Random Field)的足球视频精彩事件检测方法。通过对精彩事件视频结构语义分析,定义了9种多模态语义线索,准确地描述了精彩事件富含的语义信息;对视频片段进行物理镜头分割,提取镜头关键帧中的多模态语义线索得到特征矢量,将测试视频片段中所有镜头的特征矢量共同构成观察序列;在小规模训练样本的情况下,将观察序列作为HCRF模型的输入,有效建立了精彩事件检测的HCRF模型。实验结果表明,本文多个精彩事件的查全率平均达到95.32%,查准率达到了96.05%,检测性能明显优于对比方法。最后对本文研究内容进行了总结,展望了下一步的研究方向。