基于增量深度学习的视频行为识别

来源 :贵州大学 | 被引量 : 3次 | 上传用户:gaoaiping0322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着个人智能设备的普及和天网监控的大规模应用,视频数据的获取变得越来越便捷,对视频数据进行分析和处理的应用也变得越来越广泛,其中包括智能监控、人机交互、体育视频分析和视频检索等。视频行为识别是行为分析的核心任务和智能视频分析的基础,其任务就是从获得的视频数据中提取特征,进而对这些行为进行分类处理。近年来,伴随着全世界对公共安全的重视,如何对监控视频中的行为进行识别,成为计算机视觉领域中的研究热点。视频数据的获取和处理易受到诸多因素的干扰,如背景中自然环境的变化、各种行为之间的界定模糊、行为人衣着体貌的变化等,从而影响视频行为识别的可靠性和精确度。通过分析现有的视频行为识别框架可以发现,如果能够将应用场景限定在如室内监控等背景环境较为单一的情况下,则可以使用运动历史图像将问题简化。本文主要研究如何在非单一背景但复杂度较低的环境中使用深度网络对视频样本进行特征提取并结合高效的分类器进行分类。首先,本文针对视频行为识别的两个主要环节,即特征提取和特征分类,对现有主要技术手段的优点和不足进行了深入地分析。重现了在简单背景环境下基于运动历史图像和梯度直方图的视频特征提取方法,同时引入核非线性分类的方法。实验结果表明核非线性分类的方法比传统的k近邻(k-Nearest Neighbor,KNN)分类器拥有更高的识别率,同时在效率方面比经典的SVM算法更有优势。其次,在深入研究堆栈式稀疏自动编码机和卷积神经网络这两种典型深度学习算法的基础上,将它们分别应用于视频样本的运动历史图像的特征提取过程中,并进一步地通过使用迁移学习的策略应对深度网络训练时间长的缺陷,同时实现在小样本条件下利用更深层的网络提取特征。通过实验验证了深度学习方法比传统特征提取方法在识别率和鲁棒性方面更具优势;同时将核非线性分类方法与深度网络结合起来,在保证识别率的前提下提高了分类的效率。最后,通过研究一种非负稀疏编码算法,将增量学习方法应用到视频行为识别当中。这种增量型稀疏编码算法充分利用增量学习算法对特征进行持续学习的能力,从另一个角度应对深度学习算法训练时间过长的问题,通过实验验证了该算法与运动历史图的结合,能够成功地识别出简单背景下的行为。
其他文献
本文对河南省普通高校体育教学中的安全问题进行研究分析,旨在找出影响体育教学安全的因素,并提出一些对策,以保证高校体育课能够正常的开展,减小运动伤害事故的发生。
用碳溶解度法测定了Fe—C—Si三元系熔体在1400℃时Si对碳溶解度的影响关系。计算得到Fe—C—Si熔体的活度相互作用系数:εCSi=11.678,ρCSi=9.062,ρCC·Si=-6.579,ρSc=-3.
背景:年龄相关性黄斑变性(age-related macular degeneration,AMD)是世界范围内导致中老年人视力不可逆性损害和致盲的主要眼病,其发病率随年龄增加而升高。根据2016眼科临床
人民银行落实个人账户分类改革,将个人账户按照实名制程度分为3个类型,实质上确立了以风险为导向的个人账户管理思路。本文从账户分类政策入手,阐述了支付结算有关法规制度现
目的探讨主观综合评价法(SGA)和营养风险筛查工具2002(NRS-2002)评估放疗肿瘤患者营养状况的价值。方法住院放疗肿瘤患者102例,分别用SGA、NRS-2002和传统单项营养指标评价方
标题是新闻语篇的灵魂,具有统领全文的功能。标题中不同语言形式的选择,反映了新闻报道不同的侧面与意义,体现媒体的立场和观点。文章结合实例从批评性语篇分析的视角,以系统功能
目的监测癫痫患者抗癫痫药物的用药情况。方法采用荧光偏振法,对来宣武医院就诊的7 292例癫痫患者血清中的抗癫痫药物进行鉴定,并对结果进行分析。结果单纯服用丙戊酸钠或卡
目的评估蒂珂(Dermal Quotient,D-Q)清痘净颜护肤品联合红蓝光发光二极管(light-emitting diode,LED)痤疮治疗仪治疗痤疮的临床疗效和安全性。方法将60例Ⅰ~Ⅲ级痤疮患者随机
孔子研究和整理文献典籍的成就和贡献是卓著的.本文论述了孔子整理文献典籍的指导思想、原则和方法,同时,阐述了其思想和方法对后世的影响,认为孔子是中国最早的一位文献学家
介绍了精细化工装置工程设计的特点,并就我国具体情况提出了自己的建议。