基于卷积神经网络的红外图像人体行为识别技术研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:yyjay1315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是医疗监护、安防监控、人机交互等诸多领域的研究热点。由于红外成像系统具备可持续工作、保护隐私等优点,因此基于红外成像的行为识别方法具有重要的研究意义和广阔的应用前景。考虑到跌倒常对人,尤其是老年人造成较为严重的伤害。于是,本文选择跌倒和易与跌倒相混淆的站到坐、坐到躺行为,以及站、坐、躺、走等常见行为作为研究对象。对包含这7类行为的红外信息进行连续帧拼接操作,构建了红外图像数据集。实际应用要求识别方法具有精度高、速度快的特点,然而现有方法未能达到要求。本文提出基于改进ResNet-18网络的识别方法和基于改进MobileNet V1网络的识别方法,取得了理想的识别效果。主要工作内容和研究成果如下:(1)构建红外图像采集系统并提出图像拼接方法。首先,分析主流的红外传感器摆放方式,制定了一种较为有利的摆放策略,由此构建红外图像采集系统;其次,采集包含7类行为的红外图像;最后,为了充分利用数据的时空联系,给后续识别提供便利,并简化识别模型,使处理更高效,本文将连续多帧图像组合为一张大图,实现从三维视频到二维图像的转变,为后续识别奠定了基础。(2)提出了基于改进ResNet-18网络的行为识别方法。传统的ResNet-18网络性能优异,在可见光图像识别上表现良好,但在红外图像识别中效果欠佳。本文分析行为识别任务的特点与红外图像的特性,提出一种改进ResNet-18网络。首先,设计多分支同构结构,替换原始的7×7卷积;其次,联合平均池化与最大池化操作,对池化层进行改进;最后,结合非对称卷积块构建多重残差结构,并利用改进ECA(Efficient Channel Attention)模块和CBAM(Convolutional Block Attention Module)的空间注意力模块,构建改进CBAM模块,对残差块进一步优化。实验结果表明,改进ResNet-18网络取得了99.96%的识别率,不但优于传统的ResNet-18网络,而且明显超过经典的红外图像识别网络,取得了良好的识别效果。(3)提出了基于改进MobileNet V1网络的行为识别方法。改进ResNet-18网络虽然取得了较为理想的识别效果,但是其识别时间较长且参数量多、所需计算量大,不利于实际的工程应用。本文选择轻量化的MobileNet V1网络作为基础模型,针对该网络未能较好关注人体形态特征的问题,设计高效空间注意力(Efficient Spatial Attention,ESA)模块,以构建改进MobileNet V1网络。实验结果表明,该网络识别率达到99.83%,明显优于MobileNet V1网络;与改进ResNet-18网络相比,在识别精度几乎不变的情况下,大幅降低了运行时间、参数量与计算量,取得了优异的识别效果。
其他文献
小样本图像分类的主要目的在于学习一个具有良好泛化性能的分类模型,该模型在未见过的图像类别上仅需使用少量有标签样本进行学习,就可以取得良好的分类效果。这在现实中有着十分重要的应用价值,一方面,有些类别的样本数量十分稀少,获取难度较大,另一方面,对于有些样本而言,标注成本往往很高。因此,在标注样本数量很少的情况下,研究如何提升模型的分类性能有着极其重要的作用。在基于小样本学习的图像分类任务中,提取出更
学位
肝脏超声造影是一种针对肝癌早期筛查的医学影像技术,然而在超声造影检查过程中,由于患者存在呼吸运动,影响了造影量化诊断参数获取的准确性,从而导致诊断结果可能出现偏差。因此,开展肝脏超声造影序列图像呼吸运动校正技术研究,探究有效的呼吸运动校正技术,对提高超声造影量化诊断参数获取的准确性,促进超声造影量化诊断技术的发展具有重要意义。本文针对肝脏超声造影检查过程中受呼吸运动影响,致使造影量化诊断参数获取准
学位
现代工业中排放的染料废水和含铬废水具有毒性、致畸性和致癌性等严重危害,对生态平衡和人类健康构成严重威胁。因此,寻找能够快速有效并且廉价的吸附去除废水中污染物的吸附剂是人类社会可持续发展的关键。壳聚糖是一种广泛存在且廉价易得的生物大分子,且含有大量的氨基和羟基,能有效对污染物进行吸附。采用合适的制备技术、交联方式和修饰方法能有效提高壳聚糖材料的机械强度、可回收性能、吸附容量和选择性吸附性能。在本研究
学位
作为上世纪发展起来的新型飞行器,直升机被广泛应用于军事、救灾、旅游等各个领域。随着直升机在各领域应用更加广泛,直升机的安全性也变得愈发重要。桨毂作为直升机旋翼系统的核心部件之一,在直升机长时间飞行状态下,桨毂会由于长期受力而产生疲劳裂纹,若没有及时发现裂纹,将直接影响旋翼系统的正常工作进而影响直升机飞行安全。近些年来,利用声发射检测技术对直升机部件产生的疲劳裂纹进行检测并进行裂纹状态识别,能在很大
学位
红外传感器可以根据物体的热辐射效应得到红外图像,并且红外传感器工作在全天候,不受外界环境的干扰,但不能细腻地显示目标的轮廓和背景信息;相比之下,可见光传感器在纹理细节方面具有较高的空间识别度,符合人类视觉系统的感知,但无法显著性地突出目标。因此,整合多源图像的优势信息到单幅图像以便更细致地描述同一场景中每个物体的特征信息已经成为一个研究热点。在此背景下,由于红外与可见光图像融合研究不断深入,该项技
学位
机载视景系统是飞行控制系统的重要组成部分,具有直观、生动的信息传递方式,能够有效的降低飞行员的驾驶负担。同时凭借其实时视景画面,能够在退化视觉环境(Degraded Visual Environment,DVE)下具有同可视条件下相同的操作效率,从而为机组的飞行安全提供额外的保障。因此,机载视景系统具有非常重要的研究意义。本文对基于OpenGL es的机载视景系统进行研究,设计了基于IMX6Q与V
学位
立体视觉标定是获得三维空间点与成像像素点之间对应关系的过程。如今,立体视觉测量系统正广泛应用于大视场环境下大型工件的测量(例如:直升机旋翼桨叶运动参数测量中,桨叶直径长达4.2m)。立体视觉标定作为立体视觉测量的核心步骤,其精度直接影响测量系统的性能。汇聚型双目立体视觉系统具有公共视场大、摄像机摆放灵活等特点,更容易满足大视场环境下高精度测量的需求。因此,大视场环境下的汇聚型双目立体视觉标定技术具
学位
经直肠超声(Trans Rectal Ultra Sound,TRUS)穿刺手术是检测前列腺是否癌变的重要技术,该技术通过手术中实时2D TRUS图像与术前3D TRUS图像的空间位置关系,来快速定位前列腺中疑似癌变的组织或细胞。但是对患者进行穿刺手术时,由于采用局部麻醉,存在患者无法缓解不适而发生的身体运动,以及TRUS探头对前列腺造成挤压等情况,这些情况将导致前列腺运动,致使原本建立的术中实时
学位
本文基于导师团队中标的某航天企业废水处理工程项目,旨在通过实验研究为工程项目提供技术支持,确保顺利验收。介绍了企业的生产工艺和废水来源,以其排放的含磷废水为研究对象,进行现场水质分析,掌握水质特性。对比分析吸附、生物、离子交换、化学除磷、混凝除磷等含磷废水处理方法,针对企业含磷废水特点,结合实际生产需要,选择化学除磷+混凝除磷的方法。采用单因素实验法,从pH和投加量两个角度,通过对比三种化学除磷剂
学位
图像去雾是常见的像素级视觉任务,也是典型的不适定问题。其目的是去除给定有雾图像中的雾气,恢复出清晰无雾图像。基于深度学习的图像去雾依据是否参照大气散射模型,分为间接算法和直接算法。直接算法常利用编解码网络直接学习有雾到无雾图像的映射模型。本文针对现有数据集样本量小,包含场景复杂度低,以及编解码网络信息丢失和网络模型表达能力弱的问题,从迁移特征的学习、多层次特征的融合、网络结构及损失函数的设计进行研
学位