基于神经网络的洗手动作识别方法研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:wojiushishashou47
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
洗手动作识别是手卫生依从性监测的重要组成部分,也是人们日常生活中的重要习惯之一。传统的手卫生依从性监测虽然可以检测出对象是否在做洗手的动作,但这些方法往往依赖于传感器进行监测,无法识别出洗手动作中包含的每一步内容。近年来,机器学习和深度学习算法发展迅速,在动作识别领域已经广泛应用。在洗手动作实时识别的任务中,针对网络模型在洗手动作图像识别中准确率低的问题,而且在有限的硬件资源条件下,难以支持大规模网络模型运行等问题进行研究,具体研究内容如下:由于手部区域占图像整体比例小,环境噪声占比大,使得识别网络难以有效检测出手部位置。采用Open CV图像库在视频流数据中提取出图像帧,使用YOLO v5网络对图像帧进行手部区域检测。基于YOLO v5网络的手部区域检测模型在数据集上的平均精度均值为98.93%,平均检测速度达到了55.56帧每秒。实验结果表明,手部区域检测网络不仅可以有效检测出图像中的手部位置,而且具有良好的检测速度。由于嵌入式或移动端设备硬件资源有限,难以运行占用硬件资源高的网络模型,采用了VGG16、Res Net34、Mobile Net v2和Efficient Net-B0四种神经网络,在数据集上进行对比实验。Mobile Net v2网络的准确率为62.6%,网络规模为3.50M,训练过程中占用显存为1.54G,综合性能高于其他3种识别网络,实验结果表明Mobile Net v2网络更适用于洗手动作识别任务。为了进一步提高识别模型的准确率,以Mobile Net v2网络架构为基础,提出一种双流卷积神经网络模型。首先,针对不同洗手动作图像间像素级特征差异小的问题,在倒残差结构中引入CBAM注意力机制,使网络模型提取到图像间更多的差异信息。其次,针对特征信息利用不充分的问题,引入残差结构和CBAM构成的特征提取分支,使网络模型提取到更多的特征信息。接着,采用早融合策略融合不同网络的特征信息。最后,在解码阶段对融合后的特征信息进行解码并输出置信序列。双流卷积神经网络较原网络准确率提高了11.3%,平均查准率提高了0.092,平均召回率提高了0.02。实验结果表明了双流卷积神经网络不仅更适合于洗手动作识别任务,而且有效识别出不同洗手步骤间的差异。为使洗手动作识别网络更具实用性,将洗手动作识别网络同手部区域检测模块进行结合,搭建洗手动作实时识别系统,并部署在嵌入式设备树莓派4B中。
其他文献
在协同智能交通系统(Collaborative Intelligent Transportation System,C-ITS)中,车辆间交互携带有速度、位置和身份等信息的协同意识信息(Collaborative Awareness Messages,CAMs)以获得交通服务,但CAMs通常以明文的形式在不安全的网络上进行广播,很容易被恶意人员窃听或截获,并从中分析出用户的敏感信息。由于C-ITS
学位
近年来,越来越多的服务设备被广泛部署在公共场所以提供相应的服务,减少了人力成本。技术的提高和人们生活观念的转变,对服务设备的智能化提出了更高的要求。目前,服务设备主要采用传统的反应式交互的方式,只能在用户发起操作后再提供相应的反应。为了进一步吸引用户,提高服务设备的使用率,提供给用户更自然、人性化的交互体验,需要在“交互前”阶段根据行人的行为状态,识别并理解用户的意图以发起设备的主动交互。本文针对
学位
<正>幼儿早期阅读是指儿童进入正式学习文字之前,有关语言、读写与符号的活动,早期阅读也越来越受到学校和家庭的重视,认为是孩子认识世界的开端。《幼儿园教育指导纲要(试行)》中也提出"喜欢听故事,看图书"的目标,并特别要求:利用图书、绘画和其他多种方式,引发幼儿对书籍、阅读和书写的兴趣,培养前阅读和前书写的技能。要达到这些要求和目标,光靠在幼儿园对孩子进行早期阅
期刊
黑烟尾气不仅影响空气质量,更危害人体健康,对道路上高排放、高污染的黑烟车进行管控具有非常重要的意义。采用基于计算机视觉的智能黑烟车识别方法相较于传统人工筛查和传感器监测方法可以有效减少人力和物力的消耗,保持识别过程的客观性和公正性,具有广阔的应用前景。本文对黑烟车尾部排烟区域定位算法和黑烟多特征融合算法进行研究,具体工作如下。为了减少路面和车体等干扰信息对特征提取的影响,结合三帧差分法与累积概率霍
学位
双目立体视觉技术是计算机视觉中的一个主要的研究方向,被广泛应用在自动驾驶、三维重建等领域中。其中双目立体匹配方法的精确性对立体视觉的效果有直接的影响,因此提高双目立体匹配中匹配精度对促进双目立体视觉的发展有着十分重要的意义。在双目立体匹配过程中,对于图像中的视差不连续区域、弱纹理区域、边缘处以及被遮挡的区域,相比于其它区域,这些区域的像素更容易产生误匹配。为了提高双目立体匹配精度,将视差注意力机制
学位
随着芯片上集成的晶体管数量越来越庞大,功能模块数量持续增长,对片上网络的性能要求也随之提高。路由器作为片上网络的关键部件,直接决定了片上网络的功耗和延迟。传统的虚拟信道路由虽具有低延迟的优点,但其路由微组件较多,当片上网络中的路由器数量随着核数量一同增长时将会消耗大量的电能,如何严格控制路由的能耗已成为芯片设计人员亟待解决的关键问题。为了设计出更高能效比的片上网络,本文以存内计算技术为灵感提出了存
学位
<正>从广义上讲,站桩包括在精神境界和体能上的自我修炼。狭义上论,内练一口气,外练筋、骨、皮。一、心性修炼站桩耗劲练意志,修身炼精化气,气化神,神还虚,不仅练出内功,还可使心理到生理发生质变,面对现实,平静而不冷淡,热忱而不奔放,不为物喜,不为己悲,舍己从人又不随波逐流,努力按理智做事,成为常态。有
期刊
针对大学英语口语教学中学生学习动机不强、口语交流机会少的问题,构建了基于信息技术的大学英语口语混合式教学模式。大学英语口语课前学生线上预习,课中线下教学和信息技术深度融合,课下线上学习,参加第二英语课堂,进行拓展学习,实现了大学英语口语线上学习与线下教学的有效混合,口语教学与信息技术的深度融合。
期刊
双目立体视觉广泛应用在自动驾驶、增强现实、人脸识别、三维重建和军事侦察等众多方向中,目的是获取场景中的深度信息。立体匹配的原理是通过对立体图像对中的匹配点进行计算从而得到相应的视差值。因为获取到的视差值根据三角测量原理可以恢复场景深度,所以立体匹配是双目立体视觉系统的核心。但是,立体匹配任务对于图像中的遮挡、深度不连续、光照不均匀、弱纹理以及重复纹理区域存在误匹配率较高的问题,导致视差预测的准确度
学位
现如今互联网中的各种业务活动都会产生大量的文本数据,如何快速地从这些文本数据中获取关键信息,提高人们的阅读效率变得十分重要。基于seq2seq模型的自动文本摘要技术通过对原文进行全面的理解之后,用简洁凝练的语言概括文章的主要内容,成为了解决这一问题的关键技术手段。但模型存在对原文理解不充分以及生成的摘要缺乏原文重要信息片段的问题。因此,本文从挖掘文本深层次的语义特征以及获取原文中重要信息片段的角度
学位