基于精彩片段提取的羽毛球视频动作识别研究

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:xuxing22223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域,视频动作识别近年来倍受关注。视频通常具有丰富的场景类型,比如街道监控视频、室内监控视频和某种体育项目的比赛视频等,而针对特定场景下的视频动作识别会更具有实际意义。对于体育视频中的羽毛球单打视频,为了能更好地辅助教练分析视频中球员的动作,以及使用户可欣赏到每种击球动作的视频集锦等多元化需求,本文基于羽毛球视频精彩片段展开对羽毛球动作识别的研究。论文主要的研究内容和结论如下:(1)羽毛球视频精彩片段提取本文将羽毛球视频精彩片段定义为在羽毛球比赛视频的广播视角下,球员运动相对剧烈且播放时间足够长的视频片段。为了使用户能直接观看到羽毛球视频中比赛过程的精彩片段,以节省用户时间,研究一种羽毛球视频视角分类方法来得到有效片段,并通过目标跟踪技术进一步捕获球员移动速度,根据移动速度大小对有效片段进行筛选,得到羽毛球比赛视频的精彩片段。实验对精彩片段提取进行了有效性评价,提取的精彩片段中,实际有效的占比为93.1%,表明精彩片段提取结果良好,可为后续羽毛球动作元视频数据集的构建奠定基础。(2)基于姿态估计的击球动作时域定位针对目前方法不能很好地对羽毛球视频击球动作进行时域定位的问题,提出基于姿态估计的手臂挥动幅度计算方法,定位羽毛球视频精彩片段击球动作时域,进一步实现元视频的提取。实验结果表明,对羽毛球动作时域定位测试的交并比指标为82.6%,表明本文方法可有效定位精彩片段中球员的击球动作时域,使得后续对于羽毛球动作的识别更具有实际意义。(3)基于时序分段网络的羽毛球视频动作识别本文将轻量级注意力机制引入时序分段网络,构成注意力机制-时序分段网络,并通过人工构建的元视频数据集训练该神经网络,得到对羽毛球击动作的分类器,可将击球动作预测为正手击球、反手击球、头顶击球、挑球四种常见类型。同时提出基于形态学处理的方法将头顶击球动作进一步区分为高远球和杀球。实验结果表明,分类器对羽毛球动作预测的AUC指标皆达0.98以上。在测试集上对最终五种动作(正手击球、反手击球、高远球、杀球、挑球)的平均查全率和查准率分别达到91.2%和91.6%,说明本文方法能有效实现对羽毛球视频击球动作的识别。最后以提取的精彩片段为输入,将羽毛球动作时域定位和动作识别程序进行结合,设计了羽毛球视频动作识别系统,实现端到端输出各种羽毛球动作元视频集锦。
其他文献
在当前社会发展的背景下,由重金属引起的环境危害以及食品安全问题引起人们的广泛关注。传统的处理方式可能具有一定的局限性和不合理性,影响重金属检测结果的准确性,无法准确反映食品以及环境中重金属的真实情况,因此借助新技术高效准确地检测环境中潜在的重金属是食品安全评价和控制的必要前提。本研究以发光金属有机框架(LMOFs)为基础,重金属污染物铜和镉为研究对象,设计制备了两种多功能传感器并探究其检测机理及应
遗传算法(GA)和BP神经网络是广泛应用的两种优化算法,但均存在着一定的不足,遗传算法的局部搜索能力有所欠缺,存在早熟收敛的风险;而BP神经网络内部结构单一,容易操作,但是收敛过程较慢,并且很容易在多层网络中陷入局部最优。遗传算法-反向传播神经网络(GA-BP)算法充分利用了遗传算法和BP神经网络的优点,克服两种算法的不足,已达到较好的优化效果,已经被广泛应用到实际问题中,但该算法同样具有收敛速度
近些年来在畜牧业养殖领域,利用深度学习方法完成目标检测、目标跟踪(例如奶山羊目标跟踪)进而实现智能化畜牧养殖管理逐渐成为一种潮流。但深度学习在训练网络时往往需要大量的训练图像,否则会出现网络泛化能力弱、鲁棒性差等问题。而针对现有的奶山羊训练图像数量不足的问题,本文以西北农林科技大学畜牧教学基地采集到的五类奶山羊图像为训练数据集,利用半监督式的对抗神经网络,通过在训练过程中引入训练标签,来生成指定类
农业化肥和食品添加剂过度使用导致的亚硝酸盐污染,对生态环境和公众健康造成了严重的危害。人体若摄入少量亚硝酸盐可能导致急性中毒,若接触过量可致癌甚至死亡。因此,准确、定量监测食品中亚硝酸盐浓度对保证食品质量安全以及维护人体健康有重要意义。与传统检测方法相比,亚硝酸盐电化学传感因其操作简单、灵敏度高、分析速度快,以及可以实现小型化现场分析等优势,受到人们广泛的关注。商业碳纤维纸(CFP)因其良好的导电
水利闸门在日常使用过程中不仅直接影响着防洪防涝的安全,而且与水力发电的发电效益有着极大的关系。在闸门使用过程中,如何获取以及使用水利相关信息,并且妥善解决各种矛盾冲突,合理进行闸门控制指挥决策有着重大意义。在确保没有洪涝灾害的前提下,进行水利枢纽的实时调度,获得最大的水利枢纽运行的综合效益,是目前水利枢纽闸门自动化系统迫切需要得到解决的重要问题之一。与此同时,闸门的安全运行更是保障这些任务能够稳固
非均匀沙推移质是河道中泥沙输移的重要组成部分,直接影响河流中的水流结构、泥沙输移、河床演变等基础问题,正确认识非均匀沙推移质的运动规律是合理开发和保护河流的前提,对于促进河流动力学的发展以及满足实际工程需求都具有十分重要的意义。本文应用高速摄影技术与数字图像处理技术相结合的方法研究了非均匀沙的运动特性。主要内容有以下几点:(1)提出了利用数字图像处理与运动目标检测技术相结合的获取泥沙颗粒运动参数的
近年来,随着计算机性能的不断提升,计算机视觉领域得到迅速发展,基于计算机视觉的三维重建成为一个重要的研究方向,在社会生产生活等领域的应用也越来越广泛,其中基于图像的三维重建方法由于操作简单且恢复效果较好,成为近年来的热点问题。从单幅图像恢复目标区域的三维形状,由于其本身存在的不适定性,是三维重建中具有挑战性的工作之一。本文对基于单幅图像的三维重建方法进行了研究,主要研究工作如下:(1)提出了一种改
近年来,我国高度重视农业信息化发展。我国葡萄种植面积大、产量高。葡萄病虫害的发生将直接影响葡萄的产量和品质。葡萄病虫害知识以书籍文献形式存在,葡萄种植人员无法快速获取到葡萄病虫害知识。为解决以上问题,帮助葡萄种植从业者高效准确地获取到有价值的信息,本研究利用知识图谱组织葡萄病虫害领域知识,利用深度学习模型理解自然语言问句语义信息,设计实现基于知识图谱的葡萄病虫害自动问答系统。因目前我国葡萄产业知识
电子商务的蓬勃发展为用户提供便利的同时也带来了信息过载的问题。推荐系统能够为用户筛选出少量其真正感兴趣的物品,缓解信息过载的问题。为同时兼顾效果和性能两个方面,一般会将整个推荐系统分为召回和排序两个阶段。其中召回阶段使用简单模型,在线性时间内将系统中与用户相关的物品尽可能多的找回,形成召回候选集;而排序阶段则可以使用复杂模型,对召回候选集进行点击率预测和排序,提高最终推荐效果。综上所述,本研究构建
对动物的目标跟踪是研究其健康状况和行为分析的基础。为了准确实时地获取动物的个体信息和行动状况,本文以西北农林科技大学畜牧教学试验基地的奶山羊养殖场视频为研究对象,基于Target-Aware Deep Tracking(TADT)算法,并结合注意力机制和模板更新方法,对奶山羊对象进行跟踪及精度评价,验证了改进后算法的有效性。本文主要的研究内容与结论如下:(1)数据集的构建及预处理。为获取数量充足的