复杂场景下人体动作识别研究与应用

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:lws8228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长期以来,因人体动作的复杂性和多样性,人体动作识别一直是被广泛关注的研究热点。现有的动作识别方法在单一特定场景中效果较为突出,但应用于复杂场景中时因视频景深、天气、分辨率、光照、远景目标过小、俯视自身遮挡以及干扰物遮挡等因素的影响,很难准确地提取到人体的全部动作特征,识别效果急剧下降,复杂场景下的人体动作识别成为了一个亟待解决的难题。针对以上的问题,结合海上采油平台的实际场景,本文设计了一个复杂场景下基于目标检测、关键点检测和时空图卷积网络的动作识别框架,主要分为以下三个内容。目标检测是复杂场景下人体动作识别首要解决的问题,本文提出了适用于复杂场景中的目标检测器,利用关键点不易受繁杂背景噪声影响的特征,将人体关键点的位置作为高级特征加入目标检测。通过特征嵌入和角点池化层来建模两组角点的信息,加入中心关键点来构造关键点三元组;结合特征图中目标内部以及边界方向的响应值来预测目标,从而准确匹配属于同一目标的关键点,在存在噪声的情况下更具有鲁棒性,能够降低目标检测的误差。针对干扰物遮挡及人体自身遮挡问题,本文提出了一种改进的多级卷积姿态机算法。该算法通过身体部位定位得到所有可见的关键点坐标,使用高维空间的向量来编码不同关键点之间的关系,用于预测像素点在骨架中的二维矢量场;利用人体各部位矢量之间的位移长度建立关键点之间的相对位置关系,从而实现人体不可见关键点的预测与估计,免去了人工标注目标的繁杂工作。本文通过在人体关键点序列上构建时空图,关键点的运动轨迹以图结构的形式自然表示。通过结合时序注意力机制处理动作的类内和类间变化,对关键部位和关键帧分配合适的重要性权重,充分利用了空间和时序结构信息,这是在海上采油平台实际工程场景中实现实时在线动作识别任务的首次尝试。实验结果表明,本文提出的人体动作识别算法能够较好地解决复杂场景对动作识别造成的干扰和遮挡问题,准确率得到了明显提升,基本能够完成人体动作的在线识别任务。
其他文献
传统监控系统广泛应用于油田施工现场的险情监测中,但需要工作人员花费大量的精力查找监控视频中的险情。基于目标检测技术的监控系统,能够自主识别目标,减少对工作人员的依赖,但同时存在对小目标检测不佳的问题。为解决上述问题,本文提出了基于残差网络和改进特征金字塔的SSD算法(Residual Network and Improved Feature Pyramid SSD,RP-SSD)。首先,自主构建油
学位
皮肤病是人类最常见的疾病之一。近年来皮肤病的种类和发病率不断增长,发展成皮肤癌的病例越来越多。全球每年大约有2到3百万的皮肤癌新增病例,严重危害国民健康。皮肤癌的早期诊断和治疗对于患者恢复健康有极大意义。色素性皮肤癌类间相似度高、类内差异化大,给医学诊断工作带来了负担。随着科技的发展,深度学习已经在诸多领域得到了广泛应用,特别是在智慧医疗领域的发展。通过医学图像处理技术,结合计算机的分析能力,辅助
学位
随着计算机时代的发展,图像修复技术已经得到广泛应用,成为计算机视觉领域中的一个重要任务。最近,基于深度学习的方法在图像修复这种复杂问题上已经显示出有希望的结果。这些方法从缺失区域上下文生成语义连贯的补丁,能够生成视觉上可信的图像结构和纹理,但容易产生与周围区域不一致的伪影图像。相比之下,传统的图像修复方法通过复制图像补丁来填充缺失区域,修复效果平滑,但无法学习到图像的高级语义信息。本论文针对目前图
学位
图像翻译是计算机视觉的一个重要研究领域,其旨在学习源域和目标域之间的映射关系,并通过该映射实现特征交换。图像翻译主要分为两大类:基于监督学习的图像翻译和基于非监督学习的图像翻译。基于监督学习的图像翻译主要应用于图像生成、图像修复和图像超分辨率等领域,但这些算法需要大量成对的训练数据集,极大地限制了其应用场景。在实际的图像翻译任务中,获得大量的成对训练数据集需要耗费很大的成本,而且有时候无法获取,所
学位
在移动互联网技术和通信行业快速发展地推动下,位置服务日益受到人们的关注与应用。传统室内定位大多采用单一的定位方式,每种定位方法均存在局限性与不足,已经无法满足用户对高精度定位日益增长的需求。融合定位是指对两种或两种以上的传感器或定位方式采用融合算法进行定位。融合定位可以从一定程度上弥补单一定位方式的缺点,实现多种定位方式的优势互补,从而达到提高定位精度的目的。由于室内环境较为复杂,Wi Fi信号传
学位
员工的工作绩效表现直接影响着企业的效益,提升企业内部员工的工作绩效是企业在激烈的竞争环境中能够脱颖而出的关键,而人力资源质量也已经成为企业核心竞争力的重要标志。精益管理的应用除了要求企业革新传统的员工管理思维外,还要求企业因地制宜地制定具有针对性的精益管理模式,其对于挖掘员工潜力、优化员工绩效管理体系和提升企业经济绩效具有重要的现实意义。本文通过对ZJ公司的实地调查,发现公司当前在尝试应用精益管理
学位
TL公司是一家专业生产非公路矿用车的高新技术企业,国内市场占有率达40%,同时其产品也远销海外,已成为行业的领军者。该企业于2015年在新三板挂牌交易,目前已经进入规模化发展阶段,在此过程中企业原有的绩效考核制度已不能满足企业发展需求,急需建立一套与其战略目标相符的、完善的、科学合理的业绩考核体系。本文以TL公司绩效考核制度为研究对象,发掘原有绩效考核体系的优势与不足,运用平衡计分卡完善公司整体绩
学位
随着计算机视觉和图形图像技术的发展,三维模型在各个领域得到了广泛的应用,三维重建技术成为研究热点。重建数字岩心能够促进地质勘探和油气开采工作,对经济发展有着重要的意义。针对传统的数字岩心建模方法建立的数字岩心模型尺寸单一,分辨率固定,导致数据量过大,难以维护等问题,提出一种分层四叉树结构,基于分层四叉树构建多分辨率数字岩心,并在面模型生成、岩心切片模板匹配等方面进行优化,同时据此设计编写数字岩心重
学位
随着电子商务和网络购物平台的蓬勃发展,在线商品购物在人们的生活中显得至关重要,因此服装市场潜在着巨大的商业价值。在线商城中的服装类别繁多且数量巨大,目前存在的电商购物平台中,大部分还是通过传统的方法来检索图像,比如关键字或文本等,此类方法的本质是以文搜图。然而面对海量的服装图像数据,人工标注关键字进行服装检索的方法渐显疲态,如何有效地对网络服装图像进行检索显得尤为重要。和简单的文字描述相比,服装图
学位
胆石病是世界上发病率与死亡率增长速度最快的肿瘤疾病之一,其类型和形态多种多样。原始胆石病CT医疗图像具有胆结石病灶以及肝、胆等重要器官,目标多,并且单病人CT图像数量繁多,传统的医生面诊方式单一,造成了误诊漏诊严重的现象,极大地阻碍了胆石病医学临床领域的正确诊疗。当前,智慧医疗领域发展迅速,虽然市场上已经出现了一些具有医疗图像识别功能的产品,但是患者用户无法随时携带,应用地域较小,并且未达到商业化
学位