基于关键帧提取的人体行为识别研究

来源 :四川大学 | 被引量 : 0次 | 上传用户:popwoool20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是计算机视觉中一种重要的场景分析技术,目前已经得到广泛应用。基于视频的人体行为识别方法存在识别率不高的问题,这与视频帧提取中关键信息丢失、冗余信息较多等因素有关,也与在面对复杂场景时,使用单一特征难以对人体行为进行充分表达等因素有关。本文针对关键帧提取和人体运动视频的多特征表达进行研究,主要工作和创新点如下:(1)针对基于关键帧提取的人体行为识别,提出了一种基于动态双向时空切片聚类的关键帧提取算法。该算法首先使用基于人体掩膜热力图的动态时空切片位置选择方法计算出水平和垂直切片的位置,实现了两个方向上切片位置的动态选择,进而完成双向时空切片图像的提取。对双向时空切片聚类后,根据结果进行候选关键帧的提取,并使用筛选方案得到最终的关键帧。为了对比,在进行动态时空切片位置选择时还考虑了基于活动强度图的方法和基于人体目标检测框热力图的方法。实验结果表明,本文提出的关键帧提取算法能有效解决现有方法中普遍出现的信息冗余、关键信息缺失等问题,关键帧提取效果良好,有助于后续的人体行为识别。(2)提出了一种融合关键帧的多特征人体行为识别算法。该方法考虑到现有识别方法使用的浅层网络表征能力弱的问题,以Res Net101为基准网络搭建三流网络模型,在提取出关键帧序列后,使用空间流、时间流和骨骼流作为三个分支,提取出了RGB图、堆叠光流图、骨骼置信图的深层特征,最后使用决策级融合策略得到最终结果。实验结果表明,骨骼特征能够很好地作为RGB图像特征与光流特征的补充,关键帧的引入也能够有效提升人体行为识别的准确率。本文提出的关键帧提取算法,和以此为基础构建的人体行为识别三流网络,均在公开数据集上进行了实验和比较,验证了本文方法的有效性。
其他文献
医学图像处理作为学术界和业界的长期关注领域,具有很高的科研及应用价值。在医学临床实践中引入计算机辅助诊断系统,可以有效地减轻医生的工作压力,同时提高临床诊断准确率。伴随着人工智能技术的高速精进,基于神经网络的医学图像处理也越来越广泛地被应用到临床诊断中。基于神经网络的计算机辅助诊断系统大多依赖于海量数据进行训练学习,以实现令人满意的诊断判别效果。但是在实际生活中,很多疾病很难获取到大量有效的数据来
在视觉信息退化的环境中实现机器人的定位和导航,是目前视觉里程计的研究热点之一。目前大多数的视觉里程计基于可见光图像,只能在光照条件良好的环境中工作,当工作在夜间、雾天、浓烟以及粉尘等环境时,难以从连续的可见光图像中建立鲁棒的运动估计。热视觉里程计使用热图像作为视觉传感器输入,在上述视觉信息退化的环境中也能够鲁棒地工作,热视觉里程计能够帮助机器人实现弱光、烟雾等恶劣环境下全天候的定位和导航,这对于拓
时尚分析在时装产业、精准营销、社会行为分析等领域具有巨大的潜力,近几年越来越受到人们的关注。目前的时尚分析工作大多集中于分析服装的流行风格与流行趋势,而很少有学者关注人脸妆容的流行元素。人体的软生物特征提供人体中级描述,可以根据属性划分出具有某个特质的人群,如人脸具有多种属性,包括性别、年龄、种族、发型、发色等。本文主要致力于通过对人脸软生物特征的分析来获取唇色和发色的流行色。对于此任务,本文主要
基于视频的单目标跟踪作为计算机视觉研究领域中的基础性研究一直广受关注。通过提取视频初始帧提供的目标信息及其周围的背景信息,目标跟踪算法对后续帧中目标可能出现的区域进行预测。单目标跟踪的应用价值在多个领域都有充分体现。因此,继续对单目标跟踪算法进行深入研究依然十分重要。由于卷积神经网络在计算机视觉领域中的优越表现,现在主流的单目标跟踪算法的研究大都基于卷积神经网络进行方法设计。然而,基于卷积神经网络
飞行模拟机是训练飞行驾驶员在地面上虚拟飞行的有效设备,飞行模拟机给飞行驾驶员带来真实感的原因之一就是它逼真的视景系统,可以将飞机上可见的一切视景以虚拟的方式呈现在飞行驾驶员的眼前。当训练飞行驾驶员时,除了起飞和降落的场景都是在空中,所以云是飞行驾驶员在空中最常遇见的场景也是飞行模拟视景仿真中不可或缺的场景。相对于游戏或影视中的三维云场景而言,飞行模拟机中的三维云场景有着不一样的需求,第一,云层在飞
室外的场景通常有大气中的混浊介质存留,由于大气的吸收和散射形成了雾霾。图像采集设备受到雾霾的影响,导致获取到的图像清晰度降低、对比度下降,严重时还会导致色彩和细节信息发生变化或失真。近年来,计算机视觉技术已经普及和深入到各个行业的应用当中,在道路、航空等领域发挥着越来越重要的作用,而雾霾天气严重威胁了交通的安全。为了各类计算机视觉系统在雾霾环境下能正常工作,使得后续开展的图像分割、目标检测、图像识
近年来,合成孔径成像(Synthetic Aperture Imaging,SAI)系统中的光场成像受到研究人员的广泛关注。与传统的单个相机只能记录场景光线的二维平面信息不同的是,光场成像不仅记录场景的二维平面信息,同时记录场景光线的角度信息。由此,可以通过设定不同的参数获得不同焦距、景深(Depth of Field,Do F)的图像,在图像处理上带来了极大的便捷。利用计算成像的这些特性,也为视
颈椎作为承载人体头部的重要部分,头部的所有运动都是颈椎运动耦合的结果。随着社会发展,人们室内工作时间增加,长时间的久坐成为颈椎病发生的常见原因,最近颈椎病患者有年轻化的趋势。临床医学主要靠人体颈椎能够运动的角度范围来对颈椎正常状态进行诊断,目前临床上主流的检测颈椎运动角度的方法是利用影像医学,一般是通过拍摄颈X片的方式来评估颈椎运动功能。一种方便医生与患者的颈椎活动角度测量方法对于医生对患病程度判
随着互联网的不断发展,移动应用的需求快速增长。移动应用的质量保证是决定其成功的主要因素。测试自动化可能是提高移动应用程序质量并降低测试成本的有效解决方案,但实现移动应用的自动化功能测试是复杂且困难的,它是一项昂贵且耗时的活动,并面临诸多挑战。目前主要面临两大挑战,即测试序列自动生成和测试Oracle自动获取问题:(1)如何自动生成功能测试的测试序列,以达到自动化功能测试的目的?(2)如何自动获取测
区块链作为一种去中心化的新型分布式计算范式,具有多方创造信任、安全自治、不依赖可信第三方等特性,得到了越来越广泛的关注和应用,从最初的数字货币应用场景,逐渐拓展到了金融、贸易、征信、版权保护等诸多行业领域。联盟链相较于公有链拥有更高的交易性能和良好的监管特性,广泛受到各组织机构的青睐,其应用场景也在各行业领域得到了极大的拓展。联盟链在发展和应用过程中也遇到了各种问题与挑战,特别是联盟链的可扩展性问