人体行为识别研究综述

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:deqiangranran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为识别是计算机视觉领域意义重大的热点研究问题,它经历了从手工设计特征表征到深度学习特征表达的发展过程。本文从传统行为识别模型和深度学习模型两个方面,对行为识别发展历程中产生的主流算法进行了归类梳理。传统行为识别模型主要包括了基于轮廓剪影、时空兴趣点、人体关节点、运动轨迹的特征描述的方法,其中,改进的密集轨迹方式拥有良好的鲁棒性和可靠性;深度学习网络架构主要有双流网络、3D卷积网络和混合网络。首先,我们重点阐述了各行为识别算法的主要研究思路与创新点,并介绍了每类算法的模型架构、算法特色、适用情境等。
其他文献
针对传统方法在室内场景目标检测中存在检测精度低、检测速度慢等问题,提出一种改进的YOLOv4算法模型。构建室内场景目标检测数据集,使用K-means++聚类算法优化先验框参数,提高先验框与目标的匹配度;调整原始YOLOv4的网络结构,将跨阶段局部网络结构融入模型颈部网络中,消除在特征融合阶段梯度反向传播时导致的梯度信息冗余现象,提高对室内目标的检测能力;引入深度可分离卷积模块,取代模型中原有的3×
期刊
针对小样本数据难以构建深度学习模型,以及实际工况下多尺度形态、颜色煤矸的识别率低的问题,提出了一种融合迁移学习思想与结构优化的煤矸深度识别模型的优化方法。模仿井下实际生产环境搭建机器视觉平台,采用CCD工业相机实时获取煤和矸石图像,利用图像旋转、翻转以及增加噪声方式扩展煤和矸石数据集的多样性。从降低模型训练时间出发,提出一种迁移权重&简化神经元(Transfer Weight-Reduce Neu
期刊
针对现有人群计数方法中大多采用卷积操作提取特征,空间多样性特征信息提取和传递能力不足的问题,提出一种Involution改进的单列深层人群计数网络。该网络以VGG-16为基本框架,引入Involution算子替代卷积操作,并辅以残差链接提高空间特征信息感知和传递能力;采用膨胀卷积保持分辨率的同时扩大感受野,丰富深度语义特征;利用联合损失函数监督网络训练,提高计数准确性和全局信息相关性。所提方法在公
期刊
建筑结构构件定位是自动化进度追踪的关键。现有研究成果中,监控对象都是简单的施工现场,而现今建筑的形式越来越复杂且以现浇混凝土结构为主。为了追踪这类建筑的施工进度,基于建筑信息建模(BIM)和计算机视觉(CV)技术,提出了一种从俯视视角对现浇混凝土建筑结构构件定位的方法。该方法首先使用目标检测技术从施工现场俯视图中识别处于施工状态的建筑结构构件;并利用相机成像原理将BIM元素投影到成像平面;最后通过
期刊
针对超声全聚焦成像算法中等声程线扩散产生的原理性伪影问题,提出了一种基于超声回波声场有效等声程线和图像强度分布特征相结合的伪影剔除方法。首先分析了全聚焦成像算法中等声程线产生伪影的机理,根据数据均方根误差自适应辨识有效等声程线;通过Canny算子获取全聚焦图像待处理候选区域,再根据候选区域中有效等声程线相交次数和图像强度的分布特征辨识缺陷图像和伪影,利用图像中强度最低像素值扩展填充剔除伪影后的区域
期刊
舌体分割是智能医学诊断的重要组成部分,其目的是通过分割舌诊图像生成精准的舌体轮廓。近年来,深度学习方法在图像处理领域得到了广泛的应用并取得了较好的结果。随着医学图像分割对性能的要求越来越高,许多研究人员将深度学习运用到舌体分割中。主要对基于深度学习的舌体分割方法研究现状进行分析梳理和归纳总结。在舌体分割应用领域中,以各种深度学习方法作为研究对象,将基于深度学习的舌体分割方法划分为卷积神经网络、全卷
期刊
本文提出了一种使用多线阵相机、双光源频闪照明成像和分布式并行图像处理技术的锂电池极片涂布涂层缺陷检测方法。该方法使用明、暗光源频闪交替照明,两台高速线扫相机在同一个位置交替分别拍摄明场和暗场图像,既提高了缺陷检测分辨能力,也提高了检测效率。在处理环节,该方法使用主从分布式处理架构,使用两台子处理工控机多线程并行处理各自相机的图像数据,并将获得的缺陷数据通过TCP/IP传输至上位处理工控机进行数据融
期刊
深度相机获取深度图像由于硬件精度问题,往往会丢失大量细节信息。因此,对深度图像的滤波,已经成为深度视觉领域一个重要的课题。然而,现阶段大多数滤波的方法对于深度图像中的尖锐特征保留能力不足,往往会出现过光滑现象。针对深度图像滤波中的尖锐特征难以保留的问题,我们提出了一种新的深度图像的联合双边滤波方法。我们首先求解深度图像每个像素的法向,以投票的方式对法向的权重进行计算以进行联合双边滤波,最后根据滤波
期刊
在基于深度学习的点云分类任务中,Pointnet直接以点云的三维坐标作为输入,但其存在着对形状不规则的物体的分类效果不理想的问题。本文在Pointnet模型的基础上增加一个法矢量估计的模块,提出一种考虑点云法矢量的语义分割网络。其中,法矢量估计方法采用的是主成分分析方法。实验结果表明,本文改进模型的总体准确率、平均类别准确度和平均类别交互比相较于原始模型分别提升了2.3%、7.1%和3.9%。13
期刊
从患者的腹部CT图像中自动分割出肝脏对于肝脏疾病的诊断意义重大。由于在U-Net中使用自下而上的特征融合方式忽略了低级特征的重要性,导致网络分割性能较差,以及肝脏与相邻器官组织的灰度值较为相似,使得一些微小的细节特征不易被关注。针对以上问题,提出了一种基于多尺度语义特征融合和注意力机制的肝脏分割网络(Mutil-scale Semantic Feature Attention-Net, MSFA-
期刊