基于ResNet和LSTM的多视角个体动作识别研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:liongliong430
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多视角个体动作识别研究是计算机视觉领域的一个前沿课题,旨在通过检测多视角动作数据而提取相关特征,继而对动作特征理解以实现动作分类的过程。个体动作的多样性、不同种类动作的相似性以及相同种类动作的差异性都增加了识别难度;拍摄场景的复杂性、光照的强弱性和视角的多变性也同样影响着识别效果。为了改善多视角个体动作的识别效果,本文搭建了基于残差网络(Residual Network,ResNet)和长短期记忆网络(Long Short-Term Memory,LSTM)的融合网络模型,并在IXMAS和i3DPost两个数据集上取得了较为理想的效果。主要研究内容如下:(1)对IXMAS和i3DPost数据集进行预处理。为了提升识别效果,需要对两种多视角动作数据集进行预处理,处理过程包括图像增强、统一尺寸、数据增强、序列重构、划分数据集等操作。处理后得到了两种形式的数据集:二维图片数据集和三维图片序列数据集。(2)使用Keras框架搭建3DResNet-LSTMs级联网络模型。3DResNets不仅能同时获取动作序列的外观和时序特征,还能增加网络模型的深度;LSTM可以解决动作序列训练过程中出现的梯度问题。将预处理过的三维图片序列输入到级联网络模型中训练,取得了较好的效果。还将IMAXS数据集中准确率较高的两个视角进行融合,融合视角后各类动作的识别准确率均有提升。(3)使用Keras框架搭建2D/3DResNet-LSTMs融合网络模型。融合网络模型使用Added函数将3DResNet-LSTMs级联网络模型和2DResNet-LSTMs级联网络模型提取到的特征向量进行融合。融合网络提取的特征更全面,在两个数据集上的识别效果不仅优于单一级联网络模型同时也优于当前大多数主流网络模型,由此验证了融合模型对于多视角个体动作研究的有效性。
其他文献
随着经济全球化进程的加快和科技的飞速发展,知识产权得到越来越多的关注,各国在知识产权中的竞争也愈演愈烈。专利作为知识产权的一种体现形式,已成为国内外企业创新和发展的重要指标。由于专利文本数量庞大,且包含大量专业词汇,对专利的理解、分析和查找造成了较大的困难。因此,如何有效的处理和挖掘专利的关系类型以帮助分析、查找专利内容成为当前主要的研究热点。专利的目的是对产品结构、产品功能、产品应用、产品生产中
印染行业在中国经济发展中有重要地位,随着产业技术不断发展,车间作业环境愈发复杂,因此车间环境监测是非常必要的。目前,不同类型的印染企业在车间环境监测技术中存在人工现场查看、有线数据传输方式、智慧车间等方式,随着物联网技术的发展及其应用领域的不断扩大,本文针对小微型印染企业的车间环境监测技术采用人工现场查看、有线数据监测存在的信息收集不理想、设施安装不便利等问题,利用窄带物联网(Narrow Ban
当今社会信息飞速发展,个人信息安全是信息时代备受关注的问题。身份信息识别技术作为可有效保护信息安全的手段一直是热点研究方向。基于生物特征的身份信息认证识别技术以其稳定性、可靠性及安全性等优点被广泛应用于各领域。但在实际应用中,单模态生物特征识别技术存在如特殊人群生物特征损坏或缺失,防伪性较差等固有缺陷。针对此问题,本文提出了基于SOPC的人脸、虹膜、指纹三种单模态生物特征融合识别方案,可有效弥补上
随着人工智能的迅猛发展,交通标志提示系统在辅助驾驶、自动驾驶、交通标志维护领域具有重要研究意义。本文在分析、总结国内外最新研究进展的基础上,围绕特殊交通标志提示系统的设计与实现,重点研究了交通标志的检测与识别,以及针对光照条件不佳、倾斜、破损、被遮挡等特殊交通标志的解决方案研究,论文主要研究工作和成果如下:(1)交通标志检测。在分析交通标志先验信息的基础上结合颜色与形状特征,提出联合颜色空间分割法
随着信息技术的不断革新,网络已经成为人们获取信息的主要手段,信息也呈现出多种多样的表达形式。图像作为承载信息最重要的载体之一,如何从海量图像数据中获取必要信息,即图像处理方法,一直受到大量学者的广泛关注和研究。常见的图像处理方法包括图像的变换、压缩、增强、复原以及分割等,其中图像分割方法在图像处理领域中的作用尤为明显。图像分割的方法多种多样,为特定的对象选择合适的分割方法尤为重要,针对图像分割问题
农牧业关乎国民生计,农牧产品的质量安全是影响人们幸福指数的关键。在畜禽养殖阶段提高养殖的工作效率可以在一定程度上保证农牧产品的质量安全,而建立一套完整的畜禽信息管理系统用于提升养殖工作效率对整个农牧业有很大的帮助。国内外对于圈养型牧场的信息管理产品较为成熟,但是面向圈外放养的大型牧场相关产品研究较少。该类型牧场的特点是地域辽阔,日常巡检工作花费时间较长,人工成本大,巡检工具对天然草场破坏严重。因此
内蒙古地区生物多样性丰富,但环境污染和气候恶化等因素导致濒危植物逐年增加,开展精准有效的植物保护刻不容缓。利用装有双目相机的无人机对濒危植物开展野外生存状况调查,确定濒危植物的空间分布位置,再进行生物性状等数据的测量,对了解植物生长情况,鉴定植物濒危等级意义重大。本文围绕植物定位和生物性状测量两大需求,研究了基于双目视觉技术的植物定位和测量算法。算法涉及的主要内容有相机标定、图像去雾和立体匹配。在
物联网(Internet of Things,IoT)作为第三次信息科技革命正迅速的涌现在不同的应用领域,推动生活方式向智慧化的方向发展,提高了社会的经济效益。然而,物联网传感器层(IoT Sensors Layer,ISL)目前所面临的能耗和安全问题成为了限制其快速发展的主要因素。针对上述问题,本文将从兼顾ISL能效和安全性的角度出发,结合IoT的网络特性,对适用于ISL的高效路由协议展开研究。
雨、雪、雾霾等恶劣天气会导致严重的大气散射,这会使拍摄设备获取的视频图像色彩失真、对比度降低,导致以提取图像内部特征为基础的比如天网系统等道路监控系统和现在应用比较多的视觉识别系统无法正常工作。所以为了能使这些视频采集系统正常且稳定地工作,使有雾图像中的细节信息恢复,必须行之有效地去除图像中由于天气效果所带来的干扰,使获取到的有雾视频图像的关键信息得以重现,这样的预处理对提高视觉系统的可靠性和鲁棒
为了推动奶牛养殖业的现代化、规模化发展,我国多个部门联合发布文件推动活体奶牛抵押为奶牛养殖个体户和中小型牧场提供资金。但是活体抵押贷款中存在着很多问题。一方面,活体抵押品本身具有特殊性,容易遭受自然灾害的破坏以及被人为的恶意更换,很难作为抵押品使用;另一方面,奶牛养殖牧场往往位置偏僻,频繁派遣工作人员前往会浪费大量的人力。本文基于上述活体抵押面临的难题结合当地银行实际业务流程,使用物联网技术,流行