基于队员行为信息的体育视频内容分析方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhuxuxu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、网络技术和多媒体技术的迅速发展,多媒体数据正在呈指数级增长。视频作为多媒体数据的重要组成部分,其结构复杂,数据量庞大。体育视频由于拥有广泛的受众群体及巨大的市场潜力,以体育视频内容分析为主要目标的研究已成为视频分析领域内的一个热点。本文重点研究面向广播体育视频的内容分析技术。针对目前体育视频分析研究中存在的低层视频特征无法准确反映人类高层语义概念的问题,提出了以队员行为(轨迹、动作)分析为基础,结合音频分析的多模态融合体育视频语义分析与战术分析方法。重点讨论了广播体育视频中队员的轨迹跟踪与动作识别,基于队员轨迹与动作信息并采用多模态融合与领域知识构建视频内容的语义/战术中层表达,基于中层表达对广播体育视频进行语义内容分析与战术内容分析等几个关键技术问题。具体的研究内容如下:提出了基于支持向量机与粒子滤波的广播体育视频中队员检测与跟踪方法。首先,将支持向量分类与球场分割方法相结合,提出了一种针对体育视频中队员的自动检测算法,用来初始化后续视觉对象的跟踪。其次,将支持向量回归与序列蒙特卡罗框架相结合,提出了一种应用于视觉对象跟踪的改进粒子滤波算法,使得传统粒子滤波方法在小规模粒子集情况下能够实现对视觉对象的鲁棒跟踪,并有效提高跟踪系统的运行效率。提出了基于支持向量机与光流分析的广播体育视频中队员动作识别方法。针对广播体育视频图像质量差、摄像机非静止、队员图像分辨率低的问题,从运动分析角度出发,基于被跟踪队员区域光流场的空间分布性质,采用局部分析思想的栅格划分方法提取动作识别的描述特征。此种特征提取方法有别于传统的光流分析思想,将被跟踪区域内的光流矢量场看成是一种运动模式的空间分布信息,从而提高光流特征的鲁棒性。采用支持向量机作为模式分类器并结合时序投票策略,识别队员动作的类型。与现有基于表观特征的识别方法相比较,提出的运动描述特征及以此为基础的识别算法取得了更好的识别结果。提出了基于队员行为信息与体育比赛特定音频关键字多模态融合的体育视频摘要精彩排序方法。首先将球拍类体育比赛视频中队员的轨迹、动作信息结合音频关键字进行多模态融合,构建视频内容的“轨迹-动作-音频”中层表达。基于“轨迹-动作-音频”表达提取可计算的情感特征,用以描述用户对体育视频摘要片断进行精彩度排序的主观情感过程。考虑到目前人类情感思维的生理、心理学研究情况,提出了基于核统计学习的非线性精彩排序模型构建方法。此种构建方法不仅能够增强模型对噪声数据的鲁棒性,同时可以扩展模型的有效性与通用性。此外,还提出了精彩排序的客观评价标准,用于评价自动评估结果与主观感知事实的匹配程度。利用此评价标准,一方面可以评估精彩排序模型构建的有效性;另一方面结合前向搜索算法,从而指导情感特征的提取及有效特征的选择。提出了基于队员轨迹信息的广播体育视频战术分析方法。体育视频战术内容分析的目的在于发现体育比赛事件中队员个人或队员之间在完成一次比赛动作(或任务)过程中所使用的战术模式或比赛策略。基于比赛事件中队员和球的多对象轨迹信息,首先提出了一种基于时间片断分割的局部时间/空间交互关系分析算法,根据各时间片断中轨迹间的形状与距离度量及各片断之间轨迹的速度与距离度量,利用图模型方法构建对体育比赛中事件视频的战术表达,即交互轨迹。通过对交互轨迹中各组成片断的分析,对足球比赛视频中进攻事件的战术模式进行由粗至细的层次化识别:在粗识别过程中,将交互模式分为协同进攻与个人进攻;在进一步的精细识别中,将协同进攻模式细分为有拦截进攻与无拦截进攻,将个人进攻模式细分为直接进攻与带球进攻。
其他文献
智能移动机器人的研究体现多学科交叉领域的综合智慧,对它的研究和应用受到国内外学者的高度关注。基于视觉的低层次匹配感知、中层次检测规划和高层次辨识理解是机器人实现
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
孩提时代,我是在水乡周庄姑妈家里渡过的。周庄是座依桥傍水的江南小镇。在那老街水巷里,最使我难忘的地方要数镇上的茶馆了。 每每姑妈下班回来,如若情趣好就会催着我们快点吃
期刊
分析和设计了一个基于Android平台的高等数学移动考试系统.该系统由服务器端和客户端两大部分构成,使用Bomb后端云存放数据库,服务器端主要包括学生信息管理、教师信息管理和
为有效保障智能楼宇管理系统可靠运行,在新的起点上推动智能楼宇管理工作创新发展,本文探讨了智能楼宇管理系统运维人才队伍建设问题。
都江堰世界遗产是世界水利工程的杰出代表,文章以城市历史景观作为方法论,以真实性、完整性、可持续性为视角,将涵盖整个都江堰城乡完整的农田系统和水利系统纳入研究范畴,重新识
人类在感知外界环境的过程中,80%以上的信息来自于视觉。人类视觉感知系统中,初级视皮层从眼睛接收来自外界的信息,并按照由初级到中级,再由中级向高级的顺序分级进行信息处
自21世纪以来眼镜的使用人群逐年增长和人们生活水平的提高卫生意识的加强,眼镜清洗的必要是不可避免的。本文从调研结果中优化创新设计。创新产品的应用和功能设计理念为人
近年来,随着多媒体技术的发展和网络的不断普及,图像语义标注的自动生成方法已成为了图像检索领域的研究热点,并且计算机视觉、机器学习、自然语言理解等多个方面的技术也在
要上好一堂成功的课,事先要做好充分的准备,先谋而后动,才能立于不败之地,备课不在临时而在于平时,无准备的课不是一节好课,无准备的人生不会精彩。