基于轻量化卷积神经网络的病房监控的表情识别研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:nive123nive
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人口老龄化趋势加速使得全球医疗体系面临人力不足的严峻问题,2020年爆发的新冠疫情更是加剧了全世界高效率医疗资源的稀缺程度,利用人工智能来缓解医疗资源紧张的需求变得越来越迫切。目前少有结合了表情识别和边缘计算的病房监控研究方案,本文针对这个现状,以及轻量化卷积神经网络的表情识别准确率不足问题,展开了以下几方面的深入研究工作:1.对传统轻量化卷积神经网络Xception进行改进研究,提出了改进网络D-Xception,提升了表情识别准确率。本文的改进方法是在传统Xception的中间流引入局部密集连接和过渡层,变成3个改进密集块,具体表现为将每个密集块的输入与其后续4组深度可分离卷积的输出特征图级联(concatenate)作为该密集块的输出,并加上一个1×1卷积的过渡层用来调整通道数。另外将传统Xception的入口流缩减为2个卷积层和2个1×1残差块,出口流结构保持不变,最终得到改进网络D-Xception。改进网络通过局部密集连接加强了对特征的复用,提高了表情识别准确率,而通道数的调整,能降低改进网络的参数量。2.针对表情识别的应用,将改进网络D-Xception与主流网络进行对比实验。实验在公开数据集FER2013上进行,该数据集包含35887张表情图片,按8:2的比例被划分成训练集和测试集,测试结果与Dense Net、Mobile Net、Xception等网络在参数量和准确率上进行对比。实验结果表明,本文网络D-Xception的参数量为7.5×10~6,是传统Xception参数量的1/3,表情识别准确率能够达到70.97%,与传统Xception的68.24%准确率相比,提升了2.7%。并且进一步地对混淆矩阵分析,发现网络存在表情识别不均衡的问题,采用加权交叉熵损失函数进行优化,最终将不易被识别的Anger和Sad表情识别率分别提升了4%和3%,使表情识别更均衡。3.在上述1和2的研究工作基础上,结合改进网络D-Xception与边缘计算设计并实现了一个基于病人表情识别的病房监控系统。该系统的图像预处理、人脸检测、人脸识别和表情识别模块均部署在硬件平台树莓派3B和Intel神经计算棒上,预警模块在上位机中运行。本文分别对系统的功能性和鲁棒性进行了实验验证,功能性实验结果表明系统在硬件平台上能以5帧/s对摄像视角内病人画面直接进行7种基础表情识别,完成病人情绪状态的分析,在病人呈现非正常状态时,能通过TCP Socket连接及时向医护人员发出预警。鲁棒性实验结果表明,该系统能够适应室内夜间、强烈日光等不同光照环境,以及能实时监控多名病人的状态。综上所述,本文在理论上提出了改进的轻量化卷积神经网络D-Xception,在实验上证明了D-Xception网络的表情识别准确率较传统Xception提高了2.7%,在硬件树莓派3B和神经计算棒上设计并实现了基于D-Xception表情识别的病房监控系统。并且进一步地验证了系统的完整功能,证明本文提出的D-Xception网络可以部署在嵌入式设备上以5帧/s进行表情识别,以及与边缘计算的结合可以为未来智能病房实时监护提供一个切实有效的可选择方案。
其他文献
目前,大多数的公共场合都有监控摄像头的存在,如何利用这些监控视频数据来更好地方便人们的生活,成了计算机视觉领域研究者们需要思考的一个问题。我国早在21世纪初就建立了“天网系统”,那么在互联网时代下如何更加有效、更加高效地利用“天网系统”来对犯罪分子进行快速追踪和定位就成了计算机视觉领域亟需解决的问题;当幼儿在游乐园等人群密集的场所走失,如何运用监控视频大数据快速地帮助家长定位该儿童位置也是计算机视
在自然界中,手性选择是生物体进行生命活动的必不可少的规律之一。互为对映体的手性分子具有相同的化学式,但是两者具有不同的空间构型、光学活性和药理性能等。手性分子广泛存在于人体内、药物和日常化学品中,因此,开发方便、快速和灵敏的手性识别检测分析方法具有重要的研究意义。常用的手性识别研究方法主要包括色谱法,光谱法和传感器法。但这些方法存在操作复杂、灵敏度低、分子特异性差等缺点。表面增强拉曼光谱(SERS
在当前网络或通信系统中,密钥协商协议提供了安全的网络通信保证,可以说认证密钥协议就是网络信息安全的第一道防线。它可以提供多种安全服务来与多名当事人参加合同主体之间的信息交换,也可以实现通信对象的秘钥分发、ID认证和信息交换。它将认证技术和密钥协商技术相结合,实现了安全的网络通信,特别是在密码和智能卡的认证高度协商协议的研究开发中,用户可以存储信息,有效地实现网络通信、多用户游戏、共享工具广泛使用的
在实际生产生活中,人们更多地希望能够拍摄出更加清晰真实的照片,但是由于光线原因导致相机过度曝光,为了解决这一难题,提出使用超表面实现点扩散函数以及卷积神经网络来实现过曝光场景下的超分辨率成像。与此同时,不可或缺的是具有高分辨率,小焦斑的光学镜片。超表面(Metasurface)是指一种厚度小于波长的人工二维层状材料,在亚波长尺度中,能够灵活的有效调控电磁波的振幅、偏振、传播、相位等。并且其尺寸能够
当今时代,随着人工智能技术的发展,人机交互康复机器人在医疗领域方面的应用越来越广泛。相关研究表明,在面向脑卒中患者的康复治疗中,患者极易受到心理情绪方面的干扰,影响康复机器人对患者进行康复训练,因此,在心理层面上,开展患者主动进行康复训练的研究十分迫切。本文在生理信号分析的基础上开展情绪识别及其在手功能康复训练中的相关研究。以兴奋、烦躁、轻松为目标情绪,利用人体肌电和心电生理信号,研究一种基于生理
随着社会快速发展,互联网规模越来越庞大,多元化的网络应用类型层出不穷。技术的发展和应用种类的繁多满足了人们全方位的需求,同时也给网络的管理与维护带来了巨大挑战。准确高效地对网络流量进行分类是网络管理中的关键环节。由于用户更加注重数据隐私,以及加密算法的多样性与复杂性,造成了网络流量识别的困难。然而传统的流量识别模型和方法不能很好满足当前复杂场景的需求,研究探讨新的流量识别模型和方法具有重要的现实意
集成学习是现在非常流行的机器学习算法。目前,集成学习算法在许多著名的机器学习比赛中取得了很好的成绩。集成学习算法通过组建和联合多个机器学习算法来完成特定学习任务,业内它常被称为多分类器系统或基于委员会的学习,其常比单一学习器具有显著优越性。而且集成学习算法在金融市场的应用领域非常广泛,具体包括预测股票市场走势,预判金融市场风险,构建投资股市方案,处理大量高维抽象的信息等应用领域。投票集成学习算法属
长江口水下三角洲位于海陆交汇处,水动力环境复杂,且长江流域内输沙量年际变化,从而导致不同柱样间的沉积速率、粒度及磁性特征上具有明显的空间差异。本文选取长江口水下三角洲前缘斜坡(20 m等深线附近)2个柱样,运用210Pb、137Cs放射性比活度测年、环境磁学、粒度实验等方法,构建柱样的沉积序列,并讨论沉积物年龄、粒度对沉积物磁学特征的影响。再将研究结果与前人研究进行对比分析,得出不同柱样间沉积速率
本文对中美两国教材中“指数函数”相关习题进行数学认知层次比较研究,旨在为我国教材编写提供参考。首先,比较中美数学课程标准。接着在文献综述基础上建构数学认知层次框架:层次-1:计算——操作性记忆层次,层次-2:概念——概念性记忆层次,层次3:领会——说明性理解层次,层次4:分析——探究性理解层次,最后,将两版本习题根据数学认知层次框架分类并进行比较分析。研究得到:(1)人教版以符号表征方式为主,加州
利用人脸属性进行身份验证是最直接方便的手段,每个人的容貌随着年龄的变化会出现一定程度的改变,进而对人脸识别结果产生影响,因此人脸蕴含的大量年龄信息是识别个体的重要依据。与人脸图像分析相关的年龄估计、人脸老化合成研究是当下的热点问题,它们可以应用在很多重要的领域,如刑侦、数字娱乐等。随着社会的发展,各式各样以年龄为基础的人机交互信息系统持续改进升级,年龄估计与人脸老化合成技术在不断进步的过程中仍存在