融合边缘信息的轻量级目标检测算法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:choster
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能和深度学习的发展,目标检测成为当前的热点之一,在自动驾驶、遥感、视频监控和机器人视觉等多个领域有着广泛的应用前景。传统的目标检测算法不仅设计困难,而且不能够充分的提取目标的特征信息,算法的检测精度取决于手工设计的特征表示和特征提取算法的合理性,这也就导致检测效果不理想。目前基于深度学习的目标检测算法检测精度远远超过传统的算法成为了主流,但是目前的卷积神经网络模型对硬件要求高,往往精度越高的算法其模型越大,而越大的模型检测速度往往越慢,这就导致了精度高的目标检测算法缺乏实时性。随着轻量级卷积神经网络的发展,轻量化的检测模型也越来越得到了关注。本文以提升目标检测算法检测速度,满足实时性要求,实现目标检测算法的轻量化为目标,对FCOS算法及相关轻量化方法和改进模型方法进行了相关研究。首先,FCOS是一种一阶段的anchor-free的目标检测模型,检测精度甚至超过了部分两阶段与anchor-base的检测模型,但仍存在检测速度慢,不能实时检测的问题。针对FCOS算法不能实时检测的问题,提出了一种轻量化目标检测模ILFCOS。ILFCOS模型引入Mobile Nete V2结构作为主干网络,通过替换普通卷积为深度可分离卷积,在提高模型检测速度的同时,降低了模型大小。然后,采用减小输入的尺寸,修剪多余的特征金字塔的分支以及多尺度训练的方法,在保持检测精度的前提下大幅度提升了检测速度。接着,融入边缘信息提取模块,加入Sobel算子提取的方向梯度,增加输入数据的维度,增强边缘语义信息;使用Mish激活函数替换模型Head部分的Re LU激活函数,保留负值部分的语义信息,提高模型泛化能力;使用DIo U作为评价指标,更准确地描述预测框与目标框的相似程度,优化目标框的回归损失值。从以上这三方面优化模型算法,最终在MS-COCO2014数据集的实验结果表明,ILFCOS算法的平均准确率达到34.0,每秒检测的图片数量达到了72.5,能够满足实时检测的需求。最后,针对ILFCOS检测精度低的问题,引入注意力机制。提出一种改进的CA模块,以及两种融合注意力机制的方法。通过在主干网络和特征金字塔融入改进的CA模块,提升了模型特征提取和特征融合的能力。最终在MS-COCO2014数据集的实验结果表明,融合注意力机制的ILFCOS算法的平均准确率达到35.8,每秒检测的图片数量达到了62.3。与ILFCOS算法本身相比,虽然检测速度下降10.2FPS,但是仍远远超过实时检测的需求;与原FCOS算法相比,在精度上仅相差2.8的情况下,检测速度提升了三倍左右,成功完成了对模型的优化。
其他文献
表面等离激元(Surface Plasmons,SPs)是金属表面自由电子的集体振荡,它可将光场束缚在金属纳米结构表面以及在纳米尺度上实现对光的操控,因此具有特殊的光学性质。众所周知,通过调节金属微纳结构的材料、形状以及结构尺寸可以实现对其SPs共振特性的调控,这在纳米光子学领域具有重要的应用价值,其中基于SPs共振的折射率生物传感器是目前国内外的研究热点之一。本文通过研究金属微纳结构中电/磁SP
学位
物联网装置的接入数量剧增给人们带来便利的同时也给物联网装置带来了诸多的安全隐患,网络或者网络参与方可能遭受假冒物联网装置攻击。通过对物联网装置身份信息的可信管理,可以解决物联网装置的假冒问题。而现有的物联网装置身份信息管理方案大多需要依赖可信的中心服务器,且信任管理成本较高,可能存在中心服务器泄露物联网装置身份信息的问题。区块链技术为实现去中心化模式下的物联网装置的安全防护提供了设计思路,采用一种
学位
随着海量机器类通信(Massive machine-type communications,mMTC)系统或大规模物联网成为第五代乃至以后的蜂窝系统关键应用场景之一,部署的物联网设备数量越来越多,对更大系统容量的需求也越来越迫切。针对此种情况,可以采用大规模MIMO技术来直接增加系统容量,也可以寻求合适的多址接入技术来支持更多数量的用户,比如突破正交限制的非正交多址接入技术。针对非协同接入大规模M
学位
图像分割是医学图像处理任务中一个重要的研究方向,医学图像的自动分割在人类疾病的早期诊断中起着重要的作用。在各种类型的医学图像中,超声图像对比度低、边缘模糊且含有大量的噪声,采用传统的图像分割方法很难取得好的分割效果。虽然基于深度学习的图像分割模型能够通过特征提取来降低上述特点的影响,但主流的编解码模型结构复杂,参数量大,专注于提高分割精度,而忽视了模型的运行速度。为了应对上述问题,本文主要进行了以
学位
双钙钛矿材料以其优良的物理特性(如磁相变、自旋玻璃和交换偏置(EB)效应等)而被广泛的应用在电子存储等领域。最近在La1.5Sr0.5CoMnO6观察到的巨大的零场冷EB效应更是引起了研究人员的高度关注。针对这一问题,本文以La1.5Sr0.5CoMnO6为研究对象,重点研究了在其Co位分别掺杂非磁性离子和磁性离子对样品EB效应的调控情况。通过两者的比较,对相关磁性的微观机理进行了讨论。采用溶胶-
学位
图像作为信息获取、保存和传递的重要载体之一,在现代社会的各个领域中都起到不可替代的作用。然而,在成像过程中由于噪声、散焦、相对位移或其他因素的影响,导致图像部分信息缺失,形成降质图像。众所周知,图像盲去模糊是一个高度不适定问题,需要借助合理的先验知识约束盲去模糊模型,从而获得清晰图像的最优解。本文以鉴别性先验理论为切入点,在传统模型和深度学习框架下分别提出新的图像盲去模糊算法,具体工作如下:1、本
学位
稀土掺杂的钙钛矿结构钨酸盐由于优异的发光性能、高稳定性、独特的结构和相对较低的声子能量引起了人们关注,在发光二极管、植物生长照明、防伪和光温传感等领域逐渐被报道。光学测温相较于传统测温方式具有灵敏度高、响应速度快和非接触式的优点。本论文基于钙钛矿结构钨酸盐化合物,通过改变掺杂稀土离子的种类和浓度、掺杂过渡金属离子、激发光波长和样品结构来调控光致发光性质和光学测温能力。具体内容如下所述:(1).提出
学位
从古至今,围绕传递信息的加密和破译一直处于相互角力的状态,信息安全也始终是人们关注的焦点。而随着摩尔定律的不断深化,尤其是近年来相关量子算法以及量子计算机的快速发展,这都对现行通信网络的安全产生了巨大的威胁。量子密钥分发(Quantum Key Distribution,QKD)理论上的无条件安全性由量子力学的基本原理所保障,这给目前严峻的通信安全问题提供了一种全新的解决思路。BB84协议作为第一
学位
火灾预警可以降低灾害带来的损失。在大多数情况下,火灾中最先出现和扩散的是烟雾而非明火。因此,对烟雾进行检测并自动准确识别能及时地实现火源的定位。传统的监测手段可能会被地域大小拘束,会被周遭环境影响,或者存在一旦烟雾浓度低,范围小就不容易检测到烟雾的问题,其检测算法的准确率和鲁棒性都难达到预期。这些可以通过改进烟雾检测的算法克服以往检测方法的不足。如何区别烟雾以及和它特征相似的事物,如何快速准确地提
学位
近年来,得益于科技的快速发展,各种各样的医学图像成像技术涌现出来并广泛应用于各大医疗卫生系统,随之产生的大量医学图像的分析则需要消耗大量的资源。随着深度学习技术的兴起,越来越多的人开始将注意力转移到基于深度学习的医学图像分析方法上,医学图像分割正是其中的一个关键问题。目前,基于深度学习的方法已经在很多自然图像分割任务上取得了不错的效果,然而,与自然图像不同的是,医学图像因其自身特性在分割任务上仍旧
学位