基于密集网络的目标检测算法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:frjzj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在图像处理领域,目标检测算法已经成为了人们的研究重点,并在人类生活中有着广泛的应用。但是现有的算法仍存在一些关键问题。一方面,卷积分类网络是目标检测算法提取图像特征的基础。在提取图像特征时,卷积分类网络自身参数规模大、模型计算复杂。另一方面,被检测的目标对象存在着尺度、大小的多样性,算法对于复杂场景的目标不能有效的识别。本文从理论与地基应用出发,针对存在的问题进行了深入研究,提出了有效的解决方法。本文的主要研究内容和贡献包括以下几个方面:
  本文提出了优化的密集网络Densenet-Evo。Densenet-Evo的主要优化为自学习的分组卷积结构的设计。在网络的训练过程中,每个分组由网络自动的划分,并且会根据特征的权重逐渐删除每个分组中不重要特征之间的连接。这样既保证了网络的高度稀疏性,也降低了网络的参数数量与计算量。深层的网络更加依赖于高层特征,本文抛弃原有网络的固定增长率设置,采用了指数增长率,加大了特征传递时高层特征的比重。同时对每个密集块网络也进行了密集连接。本文在cifar-10、cifar-100数据集上进行了分类对比实验,对比的对象包括原始的Densenet以及现有的分类网络VGG-16、Googlenet、Resnet-101。实验结果表明,优化的卷积网络Densenet-Evo在保证分类性能的前提下,网络的参数量、计算量更低。
  本文设计了基于密集网络的目标检测算法以解决检测模型无法准确检测多尺度目标的问题。算法研究中结合了Densenet-Evo网络的结构特点,利用多层次、多分辨率的特征信息进行预测,不同层次的特征负责预测不同尺度的目标。在每个层次的预测过程中,为了使候选框更准确的拟合目标的真实位置,本文设置了多尺度、多比例的锚点映射框。
  通过在PASCALVOC2007数据集上进行对比实验,结果表明多尺度的预测框与多层次特征的预测更好地应对现实中不同比例的目标、有效利用了图像的特征信息,提高算法的识别精度。
其他文献
滚动轴承在工业生产领域中应用广泛,并且实际生产中滚动轴承规格繁多,不同规格滚动轴承振动信号的故障频率之间存在很大差别,传统单一规格下的故障诊断方法直接应用于不同规格情况时错误率可能偏高。因此,以高准确率实现不同规格轴承故障诊断具有重大意义。本文提出两种方法用于解决不同规格滚动轴承故障诊断问题。提出一种基于深度条件对抗网络的不同规格滚动轴承故障诊断方法。该方法首先将滚动轴承一维振动信号转换为二维图像
学位
随着人工智能的兴起,在医学图像处理方向上,数字医疗技术和智慧医疗技术开始步入医疗诊断系统中,应用计算机视觉技术取得了新进展。医学图像的信息丰富度和图片清晰度,一直是临床医生诊疗的关键判别依据。现有的医学成像方式未充分利用功能成像及解剖成像的优势,通过融合技术将两者有效结合,最大化的呈现患者病理信息,辅助医生诊断病情,有效弥补单一模态下医学图像信息缺失的缺陷。单模态的医学图像特征较简单,有效信息较少
随着工业4.0的到来,电子产品生产企业成为经济发展的重要组成部分,企业规模逐渐扩大,生产需求也随之提高。目前路径规划的效果还不够快速和精准,无法完全适应环境变化。蚁群算法以其较强的鲁棒性和优秀的寻路能力在AGV(自动引导车,Automated Guided Vehicle)路径规划问题上有广泛的应用前景。然而在实际设计过程中,基本蚁群算法非常容易陷入局部最优解,并且收敛速度缓慢。因此本文针对应用蚁
学位
指纹识别技术是目前应用最广泛的身份验证方式,这项技术的核心在于如何精准快速的提取可靠且数量多的指纹特征。为解决主流的指纹方向场获取方法存在图像灰度极值区域纹线方向不可靠、平滑操作易导致细节点方向丢失和只提取单一方向场特征的问题,本文提出图形化指纹方向解析算法。本文方法不同于基于形态学操作获取指纹特征的算法,通过建立指纹图像和二维信号之间的联系,以信号解析为主线获取指纹方向场特征。主要研究内容如下:
学位
目前钢板表面缺陷检测技术大多依靠人工目测和传统的机器视觉等方法完成。这些方法存在难以提取缺陷的本质特征、易受外界环境干扰等缺点,这些缺点导致检测精度受到影响。因此,本文研究基于深度学习的钢板表面缺陷处理技术。针对传统方法的缺点,本文引入VGG16网络模型并对其进行改进。首先在网络中加入通道注意力机制,以提高识别精度;其次采用深度可分离卷积替换网络中部分3×3卷积,以减少网络参数量和计算量,增加网络
近年来,随着全球化信息化的到来,产生了海量的数据,与此同时,频繁的数据交流和复杂的系统构建以及数据处理的时效性,对信息的网络传输和存储空间提出更高的要求,可见数据压缩在工业生产生活中越来越重要,数据压缩主要分为有损和无损压缩,其中无损压缩广泛应用于航天、医疗等技术领域。无损压缩中基于字典的压缩以自适应性强、复杂度低、编码效率高等被广泛利用,因此对无损压缩的算法研究具有十分重要的作用和意义。本文从数
学位
当今社会基于人类特征提取的生物认证技术不断发展,说话人识别作为其中之一,是通过发音人的声音来辨别身份的。该生物认证技术也被叫做声纹识别,其核心内容是将语音样本信号中提取出的能代表发音人身份的信息进行处理进而实现对各类别说话人的识别。由于近年来生物认证方法在机器学习的推动下获得了巨大进展,有着广阔的发展前景和重要的研究价值,说话人识别也深受其影响,学者们逐渐从基于传统方法的说话人识别的研究方向转移到
随着指纹识别技术的应用越来越广,人们对其识别效率和准确性要求越来越高,而现实中受采集环境或自身皮肤状况影响仍存在大量低质量指纹图像无法得到有效识别。现有低质量指纹图像识别算法以图像增强为主,在一定程度上能减少伪细节点数目,但经过特征提取后仍会存在大量伪细节点,最终导致整个指纹识别系统的性能下降,使得及时、准确识别低质量指纹图像成为目前亟待解决的一个问题。本文提出一种低质量指纹图像识别算法,该算法主
随着社会的发展和通信与信息处理技术的不断进步,生物识别技术与民众的信息安全联系越发紧密。声纹识别作为生物识别技术的一种,受到越来越多的关注,被广泛应用到手机支付、智能终端、医疗服务以及刑事侦查等领域。但是由于声纹识别的研究较短,所以仍然有很多问题尚未解决。在提取说话人的声纹特征时噪声会使说话人语音频谱发生畸变。传统自然语言处理模型由多个步骤组成,每个步骤是一个独立任务,其结果好坏会影响下一个步骤,
学位
随着软件的规模和复杂程度的不断增加,在软件开发过程中引入缺陷的可能性越来越大。而软件缺陷的存在可能会导致软件无法正常运行,甚至会危及人们的生命和财产。如果能够在软件发行之前发现缺陷,就可以合理有效地分配时间,降低成本和提高软件的质量。在实际的开发中,通常需要预测一个新的项目,或者项目所拥有的标签数据很少,在这种情况下,异构项目的软件缺陷预测应运而生。近年来,迁移学习方法的引入,解决了异构软件缺陷预