基于多尺度神经网络和自注意力机制的实时目标检测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zj280078064
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的迅速发展,数据信息的快速增长,各个领域对智能影像处理技术的需求量与日剧增。其中,最重要的一个分支就是基于深度学习的目标识别与检测。由于其具有处理速度快,检测范围广,以及可以同时处理大批量数据的优点,因此被广泛应用于智能视频监控,行人重识别,敌方舰船检测,海上救援监测等民生和军事领域。目前,基于深度学习的目标检测算法已经取得了突破性的进展,检测性能也已经得到了很大的改善。但是,在许多实时性和准确性要求更高的应用场景下,现有的实时目标检测系统仍然存在网络笨重复杂,检测速率低以及对不同尺度的目标检测准确性低等弊端。本论文将深度卷积融合网络,基于金字塔的多尺度特征融合模块,基于自注意力机制的嵌入式模块应用于实时目标检测任务中,使得网络对不同形态和大小的目标的检测精度和速度都有了明显的提升。本文主要研究内容包括以下几方面:1、提出了基于深度卷积融合网络的目标检测方法。针对深度卷积网络中不同位置语义特征不平衡,对不同尺度目标的检测精度差异性大的弊端,在基础网络上加入了基于金字塔结构的多尺度特征融合模块;针对深度卷积网络中正负样本框不平衡,对目标和背景无法精确定位的弊端,在基础网络上加入了基于两段式结构的多尺度特征融合模块。最后,在VOC数据集上对深度卷积网络和多尺度特征融合网络进行实验测试和结果对比,可以发现深度卷积融合网络的检测准确率较基础卷积网络得到了很大的提升。2、提出了基于金字塔多尺度神经网络的目标检测方法。针对SSD网络单一的特征提取方式,导致无法对小目标,密集目标,遮挡目标进行精确定位的弊端,在SSD网络中加入了基于金字塔结构的特征提取方式,使得网络能够同时提取到目标的位置偏移特征和全局轮廓特征并进行融合。最后,分别在VOC数据集和COCO数据集上对金字塔多尺度目标检测网络进行实验测试,并且与近几年优秀网络的检测准确率进行对比,充分显示出了此网络的优越性。3、提出了基于自注意力机制的嵌入式目标检测方法。针对SSD网络特征提取方式盲目性太大,特征信息冗余性太大造成的对多尺度目标的识别准确率低的弊端,加入了基于自注意力机制的预测模块;针对深度卷积网络运算速度太慢,可移植性差的问题,将基于自注意力机制的多尺度神经网络搭载到FPGA上,利用FPGA功耗低,运算速度快的特点,充分实现了对网络模型的加速优化。最后,在VOC数据集上分别对自注意力嵌入式目标检测系统的检测准确率和检测速率进行实验测试和结果对比,充分显示出了此系统的优越性。综上所述,本文对基于多尺度神经网络和自注意力机制的实时目标检测方法进行研究,实验结果证明了提出方法的可行性和有效性,说明研究成果具有一定的实际意义。
其他文献
本翻译实践报告所译原文节选自《很久很久以前……——24篇治愈系小故事》(Il était une fois...24contes thérapeutiques)一书。作者为法国放松治疗师吉尔·迪德里奇(Gilles Diderichs)。该书是一本童话故事集,在内容上大体可以分为两部分:一部分为童话故事,由家长读给孩子听,语言童趣十足,生动形象;另一部分供家长阅读,用于引导孩子参与练习与对话,进而
目标跟踪技术应用广泛,与现代人们的生活联系十分密切。视觉目标跟踪任务是指对于任意一个视频序列,只在序列第一帧给出目标的边界框,需要研究人员设计算法准确地预测出目标在剩余帧中的位置。研究人员对于目标跟踪的研究已有十多年的历史,从最开始的生成式跟踪算法,例如基于光流法、粒子滤波、Mean Shift等传统目标跟踪算法,到近几年的判别式跟踪算法,例如基于传统机器学习、相关滤波和基于深度学习的跟踪算法,跟
许多动物(包括脊椎动物和无脊椎动物)都使用血红蛋白来运输氧气,将氧气从肺、鳃或其他呼吸器官运送到需要氧气进行高效新陈代谢的周围组织。血红蛋白存在于高等生物体内的红细胞中,是血液不可缺少的成分,在生物体中发挥着重要功能。但是体内无血红蛋白的自然突变体-冰鱼的存在,为实验室构建血红蛋白缺失突变体提供了可能性。同为脊椎动物的斑马鱼和人类,其斑马鱼血红蛋白与人类血红蛋白有高度同源性,且斑马鱼自身有胚胎透明
本研究基于涡度相关技术,于2018年对民勤绿洲荒漠过渡带典型梭梭(Haloxylon ammodendron)人工林生态系统碳通量进行了观测,并结合气象与环境要素监测,研究了该生态系统的通量贡
目的:观察祛风活血丸对实验性自身免疫性葡萄膜炎(experimental autoimmune uveitis,EAU)大鼠视网膜 Notch1、Notch3、Jagged-1 表达的影响,探讨祛风活血丸对EAU的疗效和作用机制。方法:将SPF级纯系健康雄性Lewis大鼠48只(96眼)按随机数字表法分为空白组和造模组,造模组在IRBP诱导下建立EAU大鼠模型,造模成功后按随机数字表分为模型组、祛
目的本研究旨在探讨CXCL17及CXCR8(GPR35)在结肠癌中的表达情况,及其与临床病理特征及患者预后的相关性,为结肠癌预后评估和治疗提供新思路。方法实验通过选取101例结肠癌术后患者结肠癌组织,包含癌旁正常组织79例的石蜡包埋组织芯片,进行免疫组化检测,观察CXCL17和CXCR8(GPR35)的蛋白表达情况,旨在探讨CXCL17及CXCR8在结肠癌中的表达情况及其与临床病理特征及患者预后的
火灾是造成森林和草原生态系统不稳定的主要因素之一,森林和草原火灾具有突发性强、蔓延速度快的特点。应用静止卫星遥感技术,可以实现对森林草原火灾的大面积同步快速监测,
多环芳烃(PAHs)是一种致癌、致畸、致突变的持久性有机污染物,其对人体健康和环境的影响已经引起广泛关注。华北平原作为人群集聚地区,密集的工农业生产和人类活动带来的土壤—地下水多介质污染水平、污染风险和演化趋势尚不清晰,因此本文选择华北平原某代表性城市地区为研究区域,以美国EPA列入优先控制污染物名单的16种PAHs为研究对象,在取样调查的基础上,分析了土壤及浅层地下水中PAHs的污染水平、污染来
教材作为课堂教学的重要载体,为学习者提供了听、说、读、写四个方面的语言材料。其中作为构成教材语言知识的重要内容的阅读,不仅是学生阅读能力培养的教学材料来源,同时也与其他语言能力的发展具有密切的联系。因此,教材中阅读材料的选材与设计、评价与分析对学生阅读能力的发展以及课堂阅读教学的良好开展具有重要的意义。人教版高中英语教科书作为全国最广泛使用的高中教科书之一,在2004年和2019年发行过两个版本。
科技的发展带给我们很多便利,同时也在潜移默化的改变我们的生活,各种软件层出不穷,软件结构也越来越复杂,人们对软件的性能也提出了更高的标准,给软件开发带来了巨大的困难。但任何一款软件在开发出来的时候都是有一定瑕疵的,需要在投入使用后不断改进,根据用户的需求来强化系统功能,提高用户的满意度。这也给软件的开发带来了一定的风险,包含各个方面,如管理方面、需求方面、过程及技术方面等,若风险太高,将会对软件的