基于深度学习的课堂学生行为识别技术研究与分析系统设计

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:l00ok100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如果学生是一个国家蓬勃发展的年轻力量,老师是辛勤育人的园丁,那么课堂就是老师教授学业和学生掌握知识的重要场所,通过数字化技术检测与分析课堂上学生的不同行为,不仅可以提醒学生规范自身行为,还能反映课堂活跃程度,帮助老师改善教学方式。同时,为了满足各区域对优秀教育资源快速共享的要求,视频录播技术得以发展。目前市面上主流的视频录播系统仍是人工导向,需要专业人员操作摄像机进行拍摄,从而导致拍摄质量的不稳定及人力成本的提高。此外,拍摄人员在课堂中操作摄像机或走动等行为可能会打断老师的思路或分散学生的注意力,影响到课堂的教学质量。虽然目前已有部分智能录播系统采用了人工智能技术,但仅使用人脸识别或声音识别等较单一的技术来分析学生课堂表现,在实际复杂多变的课堂场景中适应性较差,存在一定的局限性。针对上述问题,本文主要研究数据融合对提升课堂学生行为识别效果的作用。其中系统性地研究了多种数据类型如人体关键点和RGB图像的课堂学生行为识别算法,基于数据融合方式如融合人体关键点与RGB图像的课堂学生行为识别算法,以及如何通过数据后处理及改进方式进一步提升效果,最终实现了一套适用于课堂环境的基于数据融合的课堂学生行为分析系统。本文核心的工作与研究内容如下:(1)在单一数据类型方面,由于目前没有公开的数据集,因此本文首先采集和制作包含端坐、起立和举手3类动作的课堂学生行为数据集,并开发了一套专用的基于关键点的学生行为标注工具,同时基于人体关键点提出一种有效识别课堂学生行为的算法,针对传统图像检测和识别问题无法忽略背景干扰造成鲁棒性较差的问题,本文将传统课堂行为识别手工提取特征这种较为繁琐的方式,转换为通过姿态估计自动得到人体关键点并基于支持向量机进行行为识别,最终通过本文提出的姿态坐标归一化、头肩区域非极大值抑制等操作进一步提升识别效果。(2)在数据融合方面,提出一种融合人体关键点与RGB图像的双流课堂学生行为识别算法。针对单一数据类型无法很好提供对识别有利特征的缺点,本文通过设计一个合理及有针对性的双流网络,融合两条支路的特征进行行为识别,从而提高了算法的鲁棒性。(3)在数据后处理方面,本文研究如何更有效提升学生行为识别算法的效果,提出了如根据训练损失值排序重新标注含有较大损失值的数据、根据热力图分布情况分析数据等方法,进而得到更适合训练的数据。实验表明,使用质量更佳的数据更有利于模型的训练。(4)在系统设计方面,本文基于跟踪去重法保存学生行为的抓拍图,可以减少误检率;根据行为统计结果基于学生课堂位置生成局部和全局行为统计图;最终实现自动导出课堂学生行为分析报告的功能。根据本文所提出的基于数据融合的课堂学生行为识别方案,进而设计并制作了课堂学生行为识别与分析系统。经多组实验对比验证,本方案的精度和召回率分别达到了92%和96%,应对不同场景仍具有较好的鲁棒性,满足实际应用需求。
其他文献
本文首先对空间管制的现状矛盾进行辨识和探究,提出目前空间管制规划的内容多为要素叠加,缺乏对区域整体生态安全的关注;规划编制缺少至上而下的逻辑联系;管理权限分散,并存
近几年,财产保险公司业务创新不断,推动着保险事业之发展。其中诉讼财产保全责任保险这一险种,由于为法院诉讼程序中的当事人提供财产保全担保,从而引起基于诉讼财产保全责任
会议
复习是对理论知识巩固加强的过程,所谓温故而知新,开展小学数学复习课堂,有利于让学生自查数学理论知识,全面学习数学内容,避免出现知识的缺失。四步五环节是打造小学数学复
本试验以川西北红原县牧区为主要研究对象,对影响红原县人工草地建植适宜性的17个指标进行筛选确立、评分、采样和空间结构分析,并对确立的各指标空间分布状况进行绘制。采用
随着社会经济发展和地震工程学科的不断进步,消能减震技术越来越多的被应用于新结构设计和既有结构抗震加固中。作为一种构造相对简单、性能比较稳定的结构消能器,屈曲约束支
工件在经历铸造、锻造、机加工、焊接等工艺后其内部会产生内应力,使工件在使用中极容易产生破坏。这就要求对工件进行时效处理以消除其内应力。但是随着科学技术的发展,传统
数据合规是指企业及其员工的数据活动需要符合一切规则。网络安全法为企业指明数据合规的方向,数据合规成为一个重要的时代课题。数据与信息、隐私既有联系,也有区别,需要合
目前变电站的巡检工作以单个的手持记录仪来完成的,没有形成一个关联的后台监控系统。论文以新形式下变电站巡检的最新要求为目标,构建基于网络的巡检人员、运维人员的多级变
随着海量的互联网数据不断增加,数字图像资源也与日俱增,面对大量的数据,人们希望计算机能够更加智能的对其进行分析处理,自动完成对海量数据的压缩、编码及冗余处理等工作,
自然场景中的文本定位方法研究是文本检测领域的难点。随着科学技术的发展,人们对于信息获取的来源不再仅限于书本杂志,在随处可见的自然场景中包含了丰富的信息,因此如何快