论文部分内容阅读
近年来,深度学习技术取得突破性进展,其主要应用于计算机视觉领域,包括两个重要的基本问题:图像识别与目标检测。其中图像识别主要应用在安防领域的人脸识别、金融、医疗等领域。图像检测广泛的应用在智能驾驶、视频监控、工业检测等诸多领域。图像识别与检测技术在诸多领域能够降低人工成本,具有重要的现实意义。图像特征信息在神经网络的卷积层或全连接层中会出现损耗问题,残差网络可以有效解决存在的缺点,但当网络较深时只有少量的单元能够有效且充分的提取特征。同时存在当使用深度可分离卷积进行特征提取时各通道间信息不能有效的融合,使得特征图含有的语义信息较少问题。针对上述问题,本文提出通道交叉融合的方法并分别构造不同的模型结构应用到脱机手写汉字识别、人脸识别及目标检测中。具体工作如下:(1)设计了多通道交叉融合的深度残差网络模型,该模型可以更好的利用残差网络的特性来进行特征提取进而提高识别精度。对中心损失函数做出了改进,将改进后的中心损失函数与传统Softmax损失函数联合作为训练监督信号有效提高模型的分类性能。在CASIAHWDB-V1.1数据集上的实验表明本文设计的识别模型及算法有效的提高手写汉字的识别率。(2)为解决模型中存在海量的计算和需要占用大量内存资源,无法满足实时性和资源受限的要求,设计了两种轻量化递归残差神经网络并分别应用在MobilenetV2主干网络上以及设计了一种梯度加权全局平均池化的方法。在LFW、AgeDB-30、CFP-FP数据集上的测试结果表明本文设计的网络模型在减少了大量参数的情况下取得了较高的人脸识别精度。(3)针对SSD目标检测算法存在对小目标检测效果不好问题,前人做了诸多改进,例如:FPN、FSSD等网络,但是这些网络都没有考虑特征图通道间信息的交流,由于网络参数较多不利于训练。因此,本文设计了特征交叉融合模型和一种周期振荡衰减学习率,该模型有效促进不同通道间信息的融合。该学习率能够在某一程度解决训练时容易陷入局部最优解的问题,实验得到较好的检测结果。