论文部分内容阅读
近年来计算机的计算能力不断提高,卷积网络被广泛的应用到图像处理任务之中,计算机视觉领域中各项视觉任务的检测性能得到了提高。目标检测任务是计算机视觉领域的重要任务之一,目标检测的功能主要是从所给的图像中找到待识别的目标,输出目标的类别与位置。该项任务以其成熟的检测技术,较快的检测速度以及优秀的检测效果为支撑,已经应用在机器人视觉以及行人检测等众多领域。这些年来,目标检测的研究取得了显著的进展,并且一步一步的应用到我们的实际生活之中。在智慧教育的推进下,目标检测技术与教育领域教学任务相结合,充分的利用教室中摄像头拍摄的图片,帮助教师更好的掌握学生在教室中的学习动态辅助教学任务的实施。本文首先分析了教育场景中目标检测技术存在的三个问题。(1)在教育场景拍摄的图片中,教室的背景信息占据图片的大部分区域,对学生的特征信息产生较大的干扰,带来学生特征表示能力弱的问题。(2)在教室拍摄的图片中,学生的人数较多,每个学生在图片中占据的尺寸更小,目标大小接近检测任务中的小目标大小,而小目标检测一直是检测任务中的难点问题。(3)教室图片中学生人数多,带来了学生之间互相的遮挡问题。而在检测的过程中每个学生会产生大量候选框,原有的NMS非极大抑制算法采用暴力的方式筛选候选框,造成部分被遮挡学生的漏检,降低了检测的准确率。针对教育场景中目标检测技术存在的上述三个问题,本文提出了一种基于区域增强和RPN双通道的目标检测网络,其主要内容有:(1)对于教育场景中学生特征表示能力弱的问题,受注意力机制的启发,在ROI池化层之后加入基于注意力机制的区域增强网络,达到提高学生特征表示能力的目的。(2)针对教室图片中学生目标尺度较小的问题,本文设计了小目标特征映射图的探究实验,验证了适合小尺度学生检测的特征层,据此设计了RPN双通道检测网络,并且改进原有锚点框的尺度,达到提高整体检测网络性能的目的。(3)为了解决传统非极大抑制算法暴力筛选候选框造成的学生候选框的漏检问题,本文根据候选框交并比的特点,提出一种改进的非极大抑制算法,将不同候选框之间的交并比IOU与候选框的置信度相关联,达到更加合理筛选候选框的目的。最后,为验证本文提出的区域增强网络与RPN双通道检测网络的有效性,本文对它们进行了消融对比试验以及与当前较好算法对比实验来验证。实验结果表明,本文提出的方法在CUHK-SYSU数据集上mAP比原算法提高了5.6%,验证了本文方法是可行且有效的,在教育场景的应用中可以取得较好的效果。