面向在线教学效果评估的头部姿态及表情识别技术研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:ztwpc2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在疫情期间,由于学员隔离在家,线上学习和在线教育成为了教学活动的主流。这很好地缓解了疫情期间的教学危机,由于是线上教学,传统的教师监督很难发挥作用。学员是否一直在线、是否认真听讲、是否领会、是否有困惑等信息无法及时反馈,这成为在线教学效果评估的瓶颈。本文旨在应用深度学习技术为在线教学效果评估提供一套有效的视觉检测和识别系统,本文的研究内容如下:(1)针对学员的移动以及人脸的偏转,MTCNN(Multi-task convolutional neural network)网络结构复杂,计算量大对视频人脸检测的准确性和实时性带来巨大影响的问题。文章提出了一种联合粒子滤波与MTCNN的快速人脸检测方法,将粒子滤波作为MTCNN算法的前置算法,为MTCNN网络推荐预选框,减少MTCNN的冗余计算。并针对粒子滤波中出现的粒子多样性降低问题,提出了分区随机粒子优化重采样方法。(2)本文通过人脸识别对学员进行身份认证,采用基于子空间的人脸识别方法,对检测到的人脸使用局部二值模式提取人脸局部特征,再通过主成分分析处理,获取降维后的特征向量,再与数据库中的人脸向量进行匹配得到身份。(3)本文将学员头部姿势作为一种辅助判据来判断学员的精神状态,采用基于SVM的头部姿态估计方法,首先通过人脸检测算法提取人脸关键点位置,通过关键点位置获取欧拉角角度值,再使用SVM进行姿态分类。(4)针对人脸表情识别任务中如何降低表情无关的面部特征的影响,本文提出了一种基于生成式网络的表情图像增强方法,构建一种DLGAN(Disentanglement Learning GAN)网络。并且为提高DLGAN对表情细节的学习能力,本文将自注意力模块引入了DLGAN的结构中。针对表情持续时间短,动作幅度小,样本数量少造成的识别精度难以提高的问题,为丰富特征输入,提出一种基于双流神经网络的表情识别算法。(5)基于本文的人脸检测、人脸识别、头部姿态估计、表情识别等计算机视觉技术,搭建了面向在线教学效果评估的头部姿态及表情识别系统,在线分析学员的情绪状态;对学员上网课时的头部姿态进行估计;检测学员睁眼闭眼,打哈欠等行为。最后根据所有检测结果给出学员状态的综合评价结果。
其他文献
某含铜污泥冶炼渣(以下简称铜渣)含铜3.50%,铜主要以金属铜和铜镍锡合金的形式存在,含铜物质嵌布粒度粗细不均匀,其中-0.01mm难选粒级占55%左右。对该铜渣开展浮选工艺研究,考察了磨矿细度、粗选pH和丁基黄药用量等条件对浮选指标的影响,并进行了全粒级浮选和筛分—浮选流程的开路对比试验。结果表明,在磨矿细度为-0.075 mm占85.76%的条件下,以丁基黄药为捕收剂,松醇油为起泡剂,全粒级开
期刊
排水路面一直受到广泛关注,在国内外都得到了长足发展与实际工程应用。相比密级配沥青路面方案,排水路面具有较大的空隙率,具有突出的排水、抗滑及降噪的特点,能够有效解决车辆在雨天行驶时产生的水雾现象及在消除路面上的一层水膜,有效降低了安全交通事故发生的几率。但随着通车年限的加长,在复杂的道路环境及自然环境下,传统排水沥青混合料出现整体骨架结构不稳定及沥青粘结力减弱的问题,从而出现飞散、剥落、坑槽等病害。
学位
近年来,有关计算机视觉和深度学习的研究和应用发展迅猛,人体行为识别已逐渐发展为计算机视觉领域里一个热门的研究主题,人体行为识别在许多方面有着重要应用,例如智能安防、视频理解等。图卷积网络的发展逐渐影响了行为识别领域,进一步带动了行为识别的发展,为许多研究人员提供了全新的思路。基于图卷积网络的行为识别的方法虽取得了很好的成绩,但仍存在一些问题。本课题基于骨架数据和图卷积神经网络进行了行为识别相关的方
学位
数据是深度学习不可或缺的因素之一,在各种视觉任务场景中都依赖着相应的数据集。训练分类器的基本假设是:基于所研究数据集不同类别中的样本数量大致平衡。现代深度学习方法在均匀分布上表现良好,然而在长尾的自然世界中样本数量是不平衡的,这种不平衡给基于深度学习的模型训练和实际应用带来了巨大的挑战。对于近年来备受关注的样本不平问题,本文定义了几种常见的不平衡形式,采用相关开源数据集对其进行重构作为研究对象。在
学位
主动脉是心血系统中的重要组成部分,同时也是疾病的高发区。在计算机辅助诊断系统(Computer Aided Diagnosis,CAD)中,基于电子计算机断层扫描(Computed Tomography,CT)的主动脉精确分割对于主动脉疾病的诊断、治疗、术前规划以及血液动力学分析等,具有十分重要的实际应用价值。但是由于主动脉复杂的管状结构且通常会与附近的纵膈组织产生重叠,因此基于CT图像的主动脉精
学位
广州地铁的快速发展使得越来越多地铁车站基坑不得不临近既有高架桥施工,基坑侧方开挖引起既有高架桥下部结构变形的预测和控制问题成为亟待解决的难题。本文依托广州某紧邻高架桥地铁车站深基坑工程,高架桥桥梁墩柱形式主要有独柱式墩和预应力门架式墩两种,桥桩与基坑的最小水平距离仅2.7m且紧邻基坑的桥桩桩底均浅于基坑底。基于此工程背景建立模型对基坑开挖过程中桥梁下部结构的变形及受力进行分析,同时确定本工程桥梁下
学位
颅内出血是指颅骨内出血。它是一种病情严重的重型颅脑类疾病,以超高的死亡率和致死率著称,一般病人被确诊就需要立即对其完成后续诊断并确定脑内出血病灶的位置和亚型,才能提升成功拯救患者的几率。颅脑CT(Computed tomography,CT)具有较高的准确性,且临床使用的范围非常广泛,是颅内出血症状初步诊断的一种有效手段。一般患者经过CT扫描之后,医生会通过其所得出的脑部CT扫描图像来对病症进行有
学位
学位
学位
学位