图像识别与目标检测的深度学习算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:camel1650
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习技术取得突破性进展,其主要应用于计算机视觉领域,包括两个重要的基本问题:图像识别与目标检测。其中图像识别主要应用在安防领域的人脸识别、金融、医疗等领域。图像检测广泛的应用在智能驾驶、视频监控、工业检测等诸多领域。图像识别与检测技术在诸多领域能够降低人工成本,具有重要的现实意义。图像特征信息在神经网络的卷积层或全连接层中会出现损耗问题,残差网络可以有效解决存在的缺点,但当网络较深时只有少量的单元能够有效且充分的提取特征。同时存在当使用深度可分离卷积进行特征提取时各通道间信息不能有效的融合,使得特征图含有的语义信息较少问题。针对上述问题,本文提出通道交叉融合的方法并分别构造不同的模型结构应用到脱机手写汉字识别、人脸识别及目标检测中。具体工作如下:(1)设计了多通道交叉融合的深度残差网络模型,该模型可以更好的利用残差网络的特性来进行特征提取进而提高识别精度。对中心损失函数做出了改进,将改进后的中心损失函数与传统Softmax损失函数联合作为训练监督信号有效提高模型的分类性能。在CASIAHWDB-V1.1数据集上的实验表明本文设计的识别模型及算法有效的提高手写汉字的识别率。(2)为解决模型中存在海量的计算和需要占用大量内存资源,无法满足实时性和资源受限的要求,设计了两种轻量化递归残差神经网络并分别应用在MobilenetV2主干网络上以及设计了一种梯度加权全局平均池化的方法。在LFW、AgeDB-30、CFP-FP数据集上的测试结果表明本文设计的网络模型在减少了大量参数的情况下取得了较高的人脸识别精度。(3)针对SSD目标检测算法存在对小目标检测效果不好问题,前人做了诸多改进,例如:FPN、FSSD等网络,但是这些网络都没有考虑特征图通道间信息的交流,由于网络参数较多不利于训练。因此,本文设计了特征交叉融合模型和一种周期振荡衰减学习率,该模型有效促进不同通道间信息的融合。该学习率能够在某一程度解决训练时容易陷入局部最优解的问题,实验得到较好的检测结果。
其他文献
目前,深度学习是大数据处理下最热门的研究方向之一。由于其强大的学习能力,卷积神经网络及其衍生模型被广泛应用到高光谱图像处理领域,通过深层神经网络挖掘图像潜在分布的
有机发光二极管(organic light-emitting diode,OLED)已有二十多年的发展史,它由于其耗材便宜、响应快、视角宽、柔性好等优势迅速受到科研人员的喜爱.近年来,为了使其更好的
实验教学是高中物理教学的重要组成部分,是学生获取物理知识、培养动手能力和创新能力,以及激发物理学习兴趣的重要途径。新课标在强调高中物理实验教学重要性的同时,也对其
蹦床运动在1997年被我国列为正式竞赛项目,是一个很年轻的运动项目,虽然中国蹦床运动起步晚,但是由于有良好的体操竞技基础,基础人才储备丰沛,蹦床在中国发展非常迅速,目前为
轨道交通的迅速发展,从时速110公里的火车到今天时速250公里的动车以及时速350公里以上的高铁,除了速度的不断提升,内部车载设备的驱动模式、控制总线、信号传输系统、监控系
随着计算机硬件和软件技术水平的飞速提升,结合计算机辅助系统的数字图像处理技术已经渗透到医学的各个学科和领域。眼睛作为人体重要的视觉器官,眼部结构由于病变引发的可视
方位编队控制是编队控制研究的一个重要课题。针对当前基于位置、距离信息编队控制的局限性,考虑仅需要方位信息的编队控制问题成为编队控制研究领域的热点之一。然而在不同
H2作为一种应用广泛的清洁能源,具有易燃易爆的特性,在生产、运输、储存过程中易发生火灾爆炸事故,对H2进行有效的探测和监控显得尤为必要。半导体金属氧化物型气体传感器由
有机-无机杂化钙钛矿材料具有较高的载流子迁移率,较长的载流子寿命,制备工艺简单并且制作成本低等优良的性质被广泛应用在钙钛矿太阳能电池、钙钛矿发光二极管等方面的研究
在遥感图像中,具有光谱波段数多、分辨率高、图谱合一等特点的高光谱图像在军事、农业、海洋以及地质探测等多个方面得到了十分广泛的应用。异常目标检测作为高光谱图像应用