基于特征融合和注意力机制的目标检测算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:hlxcun3e5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是计算机视觉领域的重要研究方向之一,广泛应用于工业生产中。在检测任务中,对于一张输入图片,检测算法通过学习来区分图片的前景和背景,然后从背景中分离出感兴趣的目标物体,进而判断物体所在的具体位置和所属类别。然而由于小物体面积小分辨率低,使得对于小目标的检测精度不能达到理想的效果。针对小目标检测的问题,本文基于SSD(Single Shot Multi Box Detector)模型做出改进,通过多尺度跨层融合、注意力机制、通道分组融合和更有效的非极大值抑制算法,实现了更高精度的目标检测算法。本文主要的研究内容如下:(1)基础网络模型通过主干网络提取特征信息,得到六个不同尺度大小的特征图,在此基础上,本文通过跨层连接来融合两个不同尺度特征图的信息,获得更丰富的特征。低层特征分辨率高,包含更多位置、细节信息,但是由于经过的卷积较少,其语义性更低,噪声更多。而高层特征具有更强的语义信息,但是分辨率很低,对细节的感知能力较差。本文通过研究多种现有的多尺度特征融合方式,提出了跨层融合的方法,实现了特征层之间更有效的信息交互。(2)本文根据注意力机制的特点,在跨层融合后对通道进行加权,使网络模型更多地关注包含物体的关键通道,而忽略对检测效果影响较小的通道。由于图像中的每个像素点对检测结果的重要程度不同,从而本文引入了注意力机制,对不同的通道根据重要程度进行加权,提升了图像有效区域的特征提取效果。(3)本文研究了感受野对目标检测性能的影响。经过多次卷积操作之后,每一层特征图上的像素点对应的输入图像的区域大小不同,即感受野大小不同。感受野越大,输出层上的像素点包含的全局信息越多。不同于之前的目标检测算法,利用扩张卷积来增大感受野,本文利用最新通道分组融合的方法,在不增加计算复杂度的情况下获得感受野更大的包含更多信息的特征。此外,在检测部分用Soft-NMS代替NMS来缓解漏检问题从而提升检测算法的召回率。实验证明,本文所提出的目标检测算法充分利用了图像信息,获取了更好的特征,实现了更高的检测精度和召回率。
其他文献
近年来国家金融、政府等基础设施部门饱受高级持续性威胁(APT)攻击的困扰,但由于分析样本的缺失,针对APT攻击的研究一直没有取得较大的进展。随着震网病毒、乌克兰停电事件、NSA武器库被盗等问题的发生,人们开始逐渐重视起这种持续时间长、攻击复杂性较高、危害性较高的网络攻击。并且由于传统的访问控制、黑白名单等检测手法无法很好的应对APT攻击,一些人工智能的方法也被引入来进行APT攻击的检测。综合其现有
复杂网络的社区是一个内部关联紧密但外部关联稀疏的节点聚类,属于网络的子图。网络的社区构造帮助我们在中观层面上描述复杂网络,分析局部和整体的关系,揭示网络的关联信息和内在属性。因此,社区发现算法的研究,对于深入理解和掌握复杂网络的基本特征具有重要意义。科研人员常运用智能优化算法理论来解决复杂网络的社区发现问题。但是,这类算法种类庞杂、标准不一,而且均需要预先设定参数来控制社区划分的侧重,无法做到自动
我国目前已是世界最大的铜材生产国,但仍不是铜材生产强国,低端产能相对过剩,而高、精、尖等高端铜材产品部分仍依赖进口,难以满足我国各行业对高端铜材的需求。此外,我国数量众多的中小型铜加工企业的产品质量水平及成品率普遍较低,这也是制约我国铜加工行业发展的突出问题,而究其原因,铜加工企业产品质量问题主要是由生产工艺技术上管理粗放造成的。近年来,为实现提质增效的目标,在国家及地方政府的政策鼓励下,国内铜加
糖尿病视网膜病变、心血管疾病、高血压、动脉硬化等多种疾病对视网膜血管产生不同影响,可通过分析视网膜眼底图像中血管的长度、宽度、角度、弯曲度和分支形式等特征来诊断。人工分割视网膜血管是一项繁琐、复杂和专业性极强的工作,且分割标准主观性强。为提高医生的诊断效率和降低误诊率,需借助计算机辅助诊断系统,其核心是设计先进的分割算法,以实现快速自动化视网膜血管分割。于是,本文分别提出了两种分割算法:基于多尺度
随着新兴技术的不断涌现和持续应用,中国制造业在过去十年间发生了翻天覆地的变化,在不断适应多变的社会需求和激烈的市场竞争的过程中,制造型企业慢慢从以量取胜向着以质取胜发展。质量意识的不断提升,使得越来越多的制造型企业开始注重生产的规范化与标准化,标准作业指导书由此受到越来越多的关注。然而,标准作业指导书在规范作业程序的同时,自身的制作流程却没有实现标准化作业,这是因为许多企业重点着力于生产线的优化改
目的研究行电子输尿管软镜下钬激光碎石术治疗的肾结石患者开展手术室人性化护理干预的效果。方法选取玉山县人民医院2019年8月—2020年1月期间收治的肾结石患者56例为研究对象,均接受电子输尿管软镜下钬激光碎石术治疗,采用双盲随机法分为研究组(28例)及对照组(28例)。对照组行手术室常规护理,研究组患者在此基础上接受手术室人性化护理干预,对2组患者术后恢复情况进行比较分析。结果研究组患者术后离床及
随着GNSS等新技术的发展,大坝变形监测已经实现全天候实时动态化,传统的大坝变形预测方法不能很好地对海量的监测数据进行处理。深度学习是在神经网络的基础上对网络层数加深的优化算法,目前已经在风电、空气质量、灾害预警等领域广泛应用。相对于传统的机器学习算法,深度学习强调从海量数据中进行学习,能够解决大坝变形数据中存在的高维、冗杂以及高噪等传统机器学习算法难以处理的问题。因此,非常有必要开展基于深度学习
随着互联网技术的发展,信息技术时代逐渐过渡到数据技术时代,数据在人们的生活中充当着越来越重要的角色。面对无所不在的数据,如何从当中获取到所需的信息变得十分困难了,这就是所谓的“信息超载”问题。传统的推荐系统在一定程度上缓解了这个问题,通过分析用户的历史行为,从海量的数据中分析出用户的偏好,并把具有用户偏好的物品推荐给用户。然而在实际应用中存在数据稀疏、冷启动等问题,它会导致推荐系统准确率低、推荐单
近年来,人工智能已成为了人们生活密不可分的一部分。随着科技的不断发展与进步,计算性能的不断提高,深度学习的发展更是迅速,而生成对抗网络作为深度学习的重要组成部分,在计算机视觉领域取得了众多成就。同时,在物质生活得到满足的当今社会,越来越多的人对动漫领域产生浓厚的兴趣,而生成对抗网络在动漫领域的应用也得到了更多人的关注,如人物图像的动漫风格迁移以及动漫头像的生成等。但是在动漫头像生成方面,仍然存在两
杨梅是浙江省重要的农果经济作物,稳居果树产值第一。然而由于杨梅树大多种植在山地丘陵地区且种植分散,致使果树种植与管理耗费大量的人力物力,因此采取自动化的方法提取杨梅树株数,实现大规模、分散果园的高效管理。但是使用卫星遥感图像提取果树往往面临方法流程繁琐、人力成本高、耗时长等问题。随着计算机软硬件的发展,基于深度神经网络的目标识别方法逐渐应用于农业、交通、医疗等行业。本文提出应用深度神经网络YOLO