基于HCRF的足球视频精彩事件检测方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zxebabi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
足球比赛持续时间长,视频数据量庞大,由于观众感兴趣的精彩事件占据比赛视频的比例较小,足球视频精彩事件自动检测便成为视频语义分析领域研究的热点和难点。目前常用的事件检测方法主要包括两大类:一类是基于机器学习的方法,另一类是基于人工规则的方法。其中,采用基于机器学习的方法检测语义事件,模型构建复杂,对训练样本数据的典型性和充分性要求较高;基于人工规则的方法,规则建立过程比较繁琐,人力耗费较大,且事件检测性能不高。因此,如何构建性能良好的语义事件模型、建立简单有效的语义规则、准确且全面地检测语义事件是目前体育视频检索领域研究的难点。本文针对足球视频精彩事件,提出了两种事件检测方法。(1)基于HMM(HiddenMarkovModel)的足球视频角球事件检测方法。通过分析足球视频角球事件的语义结构,定义并提取了六种多模态语义线索来描述镜头序列,组成观察值向量,作为HMM模型输入,经过模型迭代训练和模型参数不断优化,构建出角球事件的HMM模型,从音/视频两方面深入挖掘了角球事件的内在规律,准确实现了角球事件自动检测。实验表明,该方法检测角球事件性能良好,查全率达到了89.66%,查准率达到了96.30%。(2)基于多模态语义线索和HCRF模型(HiddenConditional Random Field)的足球视频精彩事件检测方法。通过对精彩事件视频结构语义分析,定义了9种多模态语义线索,准确地描述了精彩事件富含的语义信息;对视频片段进行物理镜头分割,提取镜头关键帧中的多模态语义线索得到特征矢量,将测试视频片段中所有镜头的特征矢量共同构成观察序列;在小规模训练样本的情况下,将观察序列作为HCRF模型的输入,有效建立了精彩事件检测的HCRF模型。实验结果表明,本文多个精彩事件的查全率平均达到95.32%,查准率达到了96.05%,检测性能明显优于对比方法。最后对本文研究内容进行了总结,展望了下一步的研究方向。
其他文献
本文研究并实现了基于达芬奇平台的夜间车辆检测系统。该系统在嵌入式平台上实时分析交通视频信号,准确计算出车流量、车速等交通参数,并能有效抵抗车灯直射摄像头产生的光晕、
全球定位系统(GPS)和捷联惯性导航系统(SINS)具有很强的互补性,本文主要研究了基于ARM的SINS和GPS的组合导航系统。本文首先对GPS和SINS进行了概述,分别介绍了两个子导航系统
Femtocell又称毫微微小区,或家庭基站,是一种小型低功率基站,覆盖范围为10-50m,主要用于解决室内覆盖问题,具有接入简单、低功耗、低成本等特点。在家庭基站和宏基站的频率资源分
网络编码自提出以来,已在理论上证明可以带来诸多好处,如大幅增加网络的容量,使分布式系统的设计更为简化。然而,目前实际系统中却很少采用网络编码技术,主要存在的问题有:引
视频的镜头类型是视频底层特征和高级语义之间的桥梁,能有效弥补两者之间的鸿沟,有助于视频精彩事件检测,促进创建视频摘要,进而满足用户快速查询和浏览视频的要求。现有视频语义
外辐射雷达系统可以利用不同体制的军用和民用电磁信号来实现定位,其自身不需要辐射电磁信号而具有较强的“隐蔽性”和“先发制人”的能力,在现代战场中,具有较高的抗打击能
SAR(合成孔径雷达)凭借其探测距离远、受气候和光线影响小等诸多优点,在国防军事上和人民生活中发挥着重要作用[1]。SAR成像需要处理的数据规模庞大,运算量大,难以实现高帧率
在人与人的交流中,信息并不完全来自于语言,还有一些从人脸得到的视觉上的信息也是非常重要的,如交流对方的性别,年龄,情感等等。所以近年来越来越多的研究人员开始研究这方面的课
建筑物透视雷达多目标跟踪系统可以最大限度地感知探测区域如目标个数、实时位置等相关信息,为灾难救援、刑事执法抓捕、反恐监视侦察等方面的决策人员制定后续相应决策提供
目前,WCDMA已成为当前世界上采用的国家及地区最广泛的,终端种类最丰富的一种3G标准。本课题就是对WCDMA侦收机进行设计和实现。WCDMA侦收机的功能包括获取小区广播信息和用