面向智慧课堂学习行为分析的头部姿态估计方法研究

来源 :华中师范大学 | 被引量 : 1次 | 上传用户:zhangjun3812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“互联网+”教育和智能技术的不断融合,智慧课堂场景下的多屏多点触控教学模式应运而生,教学内容及教学活动表现形式将更加丰富多彩。然而,以教师为主体的填鸭式教学模式将不适用于新时代背景下的师生互动关系,不利于教学效果的提升。为引导学生成为教学活动中的主体,掌握教学过程中的学生学习状态、感兴趣情况是非常有必要的。课堂学生注意力将能够客观真实地反映教学活动中学生的兴趣热点、知识盲区以及积极状态,是提高教学质量的关键。头部姿态作为学生注意力方向的主要体现方式,本文将根据智慧课堂场景,展开头部姿态估计方法上的研究。头部姿态估计是计算机视觉领域中的热点研究课题,具有广泛的应用价值和应用前景,近年来受到越来越多研究学者的关注。本文根据智慧课堂场景独有的特色以及头部姿态现有数据库所面临的问题,重新建立一个适用性更高的头部姿态数据库。并以此为基础,利用深度学习的优势,提高头部姿态算法性能,构建智慧课堂下学生注意力判别方法,在教学活动中进行有效地提示和干预,从而提高教学质量。本文的主要工作体现在以下几个方面:(1)为解决现有头部姿态数据库无法满足智慧课堂应用的需求,制作一种面向智慧课堂的头部姿态非均匀数据库(IRHP数据库)。本文首先在数据采集场景方面针对性地设计间隔15度和间隔5度的两种数据采集方法;其次在采集设备中选择红外设摄像装备,可有效避免光照变化带来的影响;最后在数据标签上,全程采用多人辅助,人工手工制作标签的方式,保证数据库标签的真实性和有效性。(2)为验证本文所提IRHP数据库的适用性和应用价值,实现一系列基于IRHP数据库的多特征分析头部姿态估计基线方法。一方面利用传统机器视觉和图像处理技术,提取多种滤波算子的人脸图像特征,对比和分析它们的优势及缺陷所在,构造合适的特征向量,将其输入到机器学习分类方法中,预测头部姿态角度。另一方面,搭建卷积神经网络模型,利用大规模人脸图像数据库对该模型进行预训练,获取有效的人脸关键特征提取空间参数,然后基于本文IRHP数据库进行实验微调,提高模型的泛化能力及鲁棒性。(3)提出一种基于多尺度特征信息融合(IRHP-Net)的头部姿态估计方法。首先根据本文任务特性,将头部姿态估计任务进行数学化表达,设置合适的损失函数,采用正则化技术提高模型泛化能力。面对卷积神经网络特征汇聚过程中的信息丢失问题,分析对比卷积过程中不同尺度的特征,探索并提出了三种特征融合算子(CW、WF以及CVF),将高层图像语义信息和低层抽象特征相结合,试图弥补训练过程中所遗漏的特征信息。训练过程使用批梯度下降算法进行模型参数的更新,实验结果证明该模型比其它方法取得更佳的性能表现。(4)基于上述头部姿态估计算法设计智慧课堂学习环境下的学生注意力判别方案。通过头部姿态估计算法识别出学生的个人注意力区域,利用相机坐标系、世界坐标系等建立几何物理模型,将个人注意力区域进行汇聚获取共同注意力区域,构造注意力分散指数以及设置阈值参数,将注意力分散指数超过阈值的学生判别其出现注意力不集中状态,提供给教师做出相关教学措施。
其他文献
在党百年华诞的重大时刻,发挥党史育人功能优势,推进党史学习教育常态化、长效化,正当其时,确有必要。用好课程教学这一主渠道,将党史学习教育融入课程思政,有助于全员、全方位、全过程提高党史育人成效。面对网络文化、社会环境、教育方式等对党史学习的影响,在“又红又专”的教师队伍引领下,找准党史融入专业课程的切入点,然后展开课程学情分析,完善教学设计,改革教学方法,将专业课程中“隐性”的思政元素“显性”化,
近些年来,随着科技的发展和机器计算能力的提升,神经网络和深度学习技术在自然语言处理领域中得到广泛的应用。在自然语言处理领域里,文本自动生成是一个重要且具有挑战性的研究方向。本文旨在根据给定的主题词生成一段可读性强的、主题相关性大的文本,此任务有以下三个难点:第一,输入信息不足。本文中的主题短文生成任务属于文本到文本的生成,在文本摘要和机器翻译这些任务中,原文本的输入提供了足够的语义信息以生成所需的
小学生编程教育对国家未来科技主导权具有极其重要影响,现已经上升到了国家战略层次。目前针对小学生编程教育平台的应用虽然有了一定的进展,但实际教学中仍存在硬件可编程性较差、设备实用性不足、编程教学案例乏味等问题。针对以上问题,采用SOM-RK3399核心板作为主控设备,集成语音处理模块、STM32控制模块等,设计并实现了一种面向小学生编程教育的嵌入式开发平台,具有研究意义与应用价值。主要研究内容如下:
课程思政与专业教育有效融合是实现立德树人的重要手段。基于“视觉设计”课程的特点,从爱国情怀、中华文化传承创新、科学思维方法、工匠精神、职业素养等方面挖掘课程思政要素,修订课程标准,优化课程思政教学内容及目标,梳理思想政治教育融入点,以期推动“视觉设计”课程思政建设取得显著成效。
文档与查询之间的语义鸿沟是信息检索领域中一个挑战性的难题。伪相关反馈是解决这个问题的一个可行的办法。由于自然语言的复杂性,传统的伪相关反馈方法很难准确判断查询与扩展项之间的语义相关度,因此这种方法不可避免地会引入一些噪音。预训练模型BERT在很多自然语言处理任务上取得了里程碑式的突破,其中Nogueira等人在MS MARCO段落检索任务上,利用BERT模型将检索精度提升了 27%左右。相对于传统
智能交通系统可以监控道路状况,是当今交通发展的必然方向。而车辆检测在智能交通系统中有着重要作用,它可以检测车流量,从而为道路交通状况提供各种重要数据。由于航拍图像的背景环境比较复杂,目标比较小且数量较多,遮挡问题比较严重,给航拍车辆的检测带来了困难,所以如何在复杂的环境下提高车辆检测的精确度具有现实的意义。YOLOv4算法代表着目前业界最先进的物体检测水平,它的检测速度超过其他检测系统,实现了速度
目前,知识图谱已广泛应用于各个领域,在教育领域的应用和成就尤为显著,知识图谱在教育教学中扮演着越来越重要的角色。编程学习作为教育领域的一个重要分支,对于初学者来说,却仍存在诸多挑战,如学习周期普遍较长、缺乏有效的学习辅助手段并且在编程实践中难以及时的获得帮助等。这些挑战给编程初学者带来极大的不便,对于其知识的掌握和能力的提升都是不利的。基于上述内容,本文在分析编程语言学科特点的基础上,围绕着编程语
计算机信息技术发展日新月异,其开发应用百花齐放,深入各行各业。计算机视觉技术对图像和视频的处理水平也日趋成熟,尤其是人脸检测和识别技术发展迅猛,在人机交互、身份验证和视频安防等领域均有一定的研究成果。卷积神经网络是深度学习的代表算法,因其良好的鲁棒性和较高的准确率,广泛应用在目标检测和模式识别领域,逐渐成为工程应用的主流选择。人机交互技术使人与机器建立连接,实现机器为人提供更加优质的服务。这些技术
伴随着互联网的发展和普及,以MOOC为代表的在线学习已成为一种新型的学习方式。在新冠肺炎疫情期间实施的“停课不停学”活动,进一步推动了 MOOC学习的应用广度和深度。虽然MOOC学习具有不受时间空间限制、受众门槛低、学习资源丰富等优势,但也存在学习者被淹没在海量的资源中、难以找到符合自身需求的学习资源以及退课率高等诸多问题,所以如何为在线学习者提供个性化的资源服务是当前在线学习领域亟需解决的问题。
从工程领域到经济学领域,大量问题都存在多个需要优化的目标,而且各个目标之间相互制约、彼此冲突,此类问题被称为多目标优化问题(Multiobjective Optimization Problem,MOP)。与传统数学方法相比,进化多目标优化算法(Evolutionary Multiobjective Optimization Algorithm,EMOA)不需要了解问题的数学特性,而且在一次运行中