基于可切换空洞卷积和注意力机制的目标检测算法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:zxjds
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测旨在对图像中的目标进行类别判定并定位。近年来,基于深度学习的目标检测算法表现尤为出色,并应用到了人类的生活中,例如无人驾驶汽车,铁路部门人脸识别,住宅小区智能安防等,这些均表明目标检测算法在提高人类生活质量,维护社会秩序上起着越来越重要的作用。然而由于目标信息提取不足以及背景环境干扰等问题,目标检测仍然存在错检、漏检的情况,如何对目标进行更准确的检测,成为了一项具有挑战性的问题。因此,针对上述难点,本文结合可切换空洞卷积(Switchable Atrous Convolution,SAC)、全局上下文网络(Global Context Network,GCNet)、路径聚合特征金字塔网络(Path Aggregation Feature Pyramid Networks,PAFPN)和平衡特征金字塔(Balanced Feature Pyramid,BFP)提出了改进方案。主要研究工作如下:(1)针对目标检测算法存在检测准确率较低的问题,我们提出了基于残差网络Res Net50和可切换空洞卷积SAC的目标检测方法。SAC结构将切换函数分别作用于空洞率为1的可变卷积和空洞率为3的可变卷积,并将作用后的特征信息进行融合,扩大了特征感受野并实现了特征感受野的自适应选取,增强了模型对图像特征信息的提取能力。在Pascal VOC数据集上实验结果表明,该模型的整体检测精度以及各类别的检测精度均得到了有效提升。(2)针对图片环境干扰而产生的目标漏检、错检的问题,我们提出了融合GCNet注意力机制的目标检测方法。GCNet注意力机制属于全局注意力,通过生成全局注意力特征图帮助模型从全局视角重点关注目标信息,从而在一定程度上避免了图片环境干扰造成的目标漏检、错检的情况。在Pascal VOC数据集上的实验结果表明,该模型在检测图片环境干扰目标时检测效果有所改善。(3)针对目标检测模型低层特征利用率低以及多尺度特征利用不平衡的问题,我们提出了基于PAFPN多尺度特征融合和BFP特征增强的目标检测方法。PAFPN帮助模型加强对低层定位信息的利用,BFP进一步对多尺度特征进行增强并平衡了多尺度特征信息。在Pascal VOC数据集上该模型的检测准确率提升到83.7%;在MS COCO数据集上,该模型的准确率相比自适应训练样本选择(Adaptive Training Sample Selection,ATSS)算法提升7.2%,表明了我们所提模型的有效性。
其他文献
基于Web of Science和中国知网数据库,运用CiteSpace知识图谱可视化方法,分析国内外生态风险评价的研究进展。结果表明:(1)1990—2020年国内外生态风险评价研究文献数量均快速增长,其中国内文献数量增长更快;(2)国内外文献作者及研究机构之间基本形成合作网络体系,中国科学院的发文量在国际位于领先地位;(3)关键词和关键词聚类可视化分析表明生态风险评价研究长期聚焦在水环境、重金
期刊
随着深度学习与计算机视觉技术的发展,图像分类已经在生产生活中得到了广泛的应用。近些年,如垃圾分类、商品识别、人脸支付等AI应用给人们的生活带来了极大的便捷,这些应用的发展得益于海量带标签的图像数据集。然而,数据集标签的质量直接影响了模型的泛化性能和分类精度。因此如何利用这些带有错误标签的图像数据集,设计鲁棒性强、精度高的模型就显得尤为重要。关于带噪声标签图像分类问题,本论文主要研究工作分为以下三点
学位
阿尔茨海默病作为当下发病率较高、影响范围广泛、致病机制复杂的神经退行性疾病之一,在近40年内一直是学术界重点研究的对象。关于阿尔茨海默病关键蛋白β淀粉样蛋白及其前体蛋白(APP),则先后形成了沉积斑块致病假说和寡聚体致病假说。然而近年来随着研究技术的发展,β淀粉样蛋白沉积斑块和β淀粉样蛋白寡聚体之间的关联性的发现,使得两种致病假说的相关性提升。本文综述了近年来国际学术界对于β淀粉样蛋白及其前体蛋白
期刊
少数民族服饰作为民族文化特色的载体,在民族传统文化中具有重要地位,研究少数民族服饰图案,对保护和传承民族传统文化有重大意义。由于少数民族服饰图像存在背景复杂程度低,同民族服饰饰品较为相似等情况,利用目前已有的分割网络技术容易出现过拟合,相似物体分割任务难度增加等技术问题,本文从深度学习方法着手,利用卷积神经网络和多层感知机,通过在网络中加入注意力机制以及选择合适的损失函数等技术,提出了一种基于深度
学位
情感是智能生命区别于其他生命的最基本特征之一,也是日常对话中不可或缺的一部分。本文把情感分析应用在英语教学中,使得英语学习者能够更好的进行英语的朗读。情感分析模型通常可以分为两类:单模态和多模态。单模态情感的研究只使用原始音频信号或者文本,而对多模态情感的研究则同时使用音频信号和词汇信息,在某些情况下还会使用视觉信息。由于情感的复杂性,语音情感分析是一项困难的任务,其的性能在很大程度上取决于从语音
学位
本文就如何发现具有"特长比较优势"的学生以及如何进行正确的引导与培养展开探讨。
期刊
曾经“明股实债”作为融资环境趋紧的形势下有效降低财务杠杆,规避监管要求的融资手段,受到资金密集型企业的房地产公司的追捧,然而由于该融资方式在实际应用中存在收益条件设计复杂、投资方式不明确、缺乏完善的法律及税收规范等问题,给相关企业的财税处理带来较大的争议和风险。本文首先就“明股实债”的相关概念进行概述,进而分析其在实务处理中存在的财税问题,最后进行探讨分析并提出建议。
期刊
<正>随着核心素养理念的日益深化,教师逐渐自觉提升写作教学的设计性、策略性以及实效性,力求借助高品质的写作教学提升课堂互动的价值性与指导性,科学推动小学生缜密思考、多维思辨、优质表述,从而写出优秀的作文。在写作教学实践中,教师一般安排记叙文与说明文两种类型的写作任务,因而需要教师立足两种不同的写作内容进行分类指导。这样,分类指导活动开启了写作教学的新策略与新局面,为小学生提供了更高质量的思维点拨与
期刊
随着互联网的发展,数据共享已经成为一种趋势,数据共享系统中的安全问题受到了人们的重视。访问控制技术能够防止用户的非法访问,是保护数据安全的重要方法之一。基于属性的访问控制机制根据用户和数据的属性决定该用户是否能访问某个特定的数据,实现了细粒度的访问控制,使得大规模的数据共享系统更灵活、更高效、更易于管理。然而,基于属性的访问控制机制要求数据拥有者为每个共享数据制定一个相应的访问策略。随着云存储等大
学位
劳动精神是民族精神和时代精神的生动体现,是中国共产党精神谱系的重要内容,将其融入高职院校思政课有助于落实“立德树人”根本任务,推动高职院校思想政治理论课改革创新。劳动精神与高职院校思想政治理论课目标一致、内容贯通、优势互补,这是劳动精神融入高职院校思政课的理论基础。高职院校思政课教师应深耕教学内容、丰富教学方法、立足多维实践、促进劳动精神全方位、高质量融入思政课教学。
期刊