【摘 要】
:
目标检测是图像分析与理解等大量高层次视觉任务的基础,YOLOv3作为目标检测技术中最受欢迎的算法之一,由于具有良好的泛化能力,应用广泛。为了满足终端设备高检测精度、低内存占用的算法部署需求,本文从提高检测精度、压缩模型参数两个方面对目标检测算法进行研究,最终以YOLOv3为基准对其进行改进。在提高检测精度方面,从可嵌入到模型中的注意力方法和模型训练时使用的数据增强方法两个角度入手。针对注意力,结合
论文部分内容阅读
目标检测是图像分析与理解等大量高层次视觉任务的基础,YOLOv3作为目标检测技术中最受欢迎的算法之一,由于具有良好的泛化能力,应用广泛。为了满足终端设备高检测精度、低内存占用的算法部署需求,本文从提高检测精度、压缩模型参数两个方面对目标检测算法进行研究,最终以YOLOv3为基准对其进行改进。在提高检测精度方面,从可嵌入到模型中的注意力方法和模型训练时使用的数据增强方法两个角度入手。针对注意力,结合YOLOv3算法的检测原理,将锚框信息作为先验知识引入到注意力方法中,得到改进的注意力方法。对比实验表明,使用了改进的注意力方法的YOLOv3算法相比于原始的YOLOv3算法在VOC2007和VOC2012数据集上分别有0.7%和0.4%的mAP提升。针对数据增强,将MixUp和Mosaic两种方法结合得到改进的数据增强方法。为验证改进方法的通用效果,使用基准网络PyramidNet在CIFAR-100和CIFAR-10数据集上进行对比实验,结果表明,模型训练时使用改进的数据增强方法之后,Top-1错误率相比于未使用之前分别降低2.47%和1.31%。在模型压缩方面,提出将零激活占比大于阈值的卷积核过滤掉之后再进行FPGM剪枝的改进策略。为验证改进方法的通用效果,以ResNet-56为基准网络在CIFAR-10数据集上进行对比实验,结果表明,ResNet-56使用改进的FPGM剪枝策略后,相比于未剪枝之前FLOPs减少53%左右,准确率相比于未剪枝之前提高0.05%左右。综合以上提出的改进方法,在MS COCO数据集上进行对比实验。结果表明,YOLOv3算法网络结构中添加改进的注意力方法,训练时使用改进的数据增强方法,得到推理模型后再用改进的FPGM剪枝策略进行剪枝,最终AP可达到37.9%,相比于未改进之前提高6.9%,网络参数量由59.6M降低到33.1M。改进的YOLOv3算法相比其他性能优异的算法虽有一些差距,但相比YOLOv3本身仍有较大的性能提升。
其他文献
金属带式无级变速器(Metal Belt Continuously Variable Transmission,简称 MB-CVT)作为一种理想的车辆变速装置在乘用车上被广泛应用,但其核心元件——钢带生产技术被国外企业垄断,为解决此问题,本团队学者提出钢绳环式无级变速器(Wire Rope CVT,简称WR-CVT),以钢绳环替代钢带,为推动CVT国产化提供新的探索思路。本文依托西安市科技计划项目
为了降低人类生活对石油资源的依赖程度,改善人类生存的环境质量,世界各国都在提倡大力发展新能源汽车。而四轮独立驱动电动汽车作为新能源汽车的一种新型布置形式,简化了整车传动系统,提高了传动效率和整车的可控自由度。通过对各轮毂电机输出转矩进行精确控制,以此改善车辆行驶过程中的操纵稳定性是四轮独立驱动电动汽车亟需解决的一项关键技术问题。本文针对该关键技术问题,通过以下具体工作完成驱动力分配策略设计和实验验
煤矿井下移动机器人定位技术是直接影响煤矿机器人性能的关键技术问题。由于煤矿井下无GPS和BDS定位信号,工作场景复杂,且煤壁对信号屏蔽严重,导致地面移动机器人定位技术在井下应用较为困难。本文针对煤矿井下移动机器人定位难题,提出了一种基于单目视觉与捷联惯导信息融合的定位方法。研究分析了单目相机的解算原理与捷联惯导系统的基本定位原理,建立了单目相机与捷联惯导定位误差模型,完成了单目相机与捷联惯导的参数
肝癌是全世界发病率和死亡率极高的恶性肿瘤,严重威胁着人们的身体健康,通过早期的筛查和治疗可以有效地减少癌症的发病率和死亡率。医生获取病人腹部CT图像后,要进一步判断肝脏肿瘤的位置、大小、体积等信息,需要将图像中肝脏肿瘤区域标注出来,然而手工分割需要耗费大量的时间和精力。为了提升肝脏肿瘤分割的精准度和效率,本文提出了基于U-Net网络的肝脏及其肿瘤CT图像分割方法的研究。(1)针对传统的基于灰度、边
在智能安防、搜索救援、环境监测等领域,与单体机器人系统相比,多机器人系统具有更强的容错能力、更好的适应性和资源的高效利用率,多机器人系统对系统体系结构设计、运动规划与协作编队控制算法均提出新要求。多机器人系统采用分层式结构协同体系,对A*算法改进并与带有机器人及环境约束的TEB(Time Elastic Band)方法相结合使单机器人具有运动规划能力,采用交通规则法解决多机器人冲突问题,针对多机器
矿井信息化、智能化的发展与无线通信技术密切相关。在矿井中存在多种不同的无线通信系统并且每种通信系统采用的信号调制方式各不相同,因此要形成安全可靠的矿井通信网络系统,就必须实现不同通信系统间的信号调制方式识别。本文主要针对矿井无线信道环境研究了基于信号特征提取的调制识别方法和基于深度学习的调制识别方法,对矿井衰落信道下的 BPSK、QPSK、8PSK、16PSK、16QAM、64QAM、256QAM
脑机借口系统通过建立大脑与外部设备之间的信息传输通路,实现对外部设备的控制,为恢复人类受损的运动功能提供了一种有效方法。系统主要包括大脑(模型)、解码器、编码嚣和外部设备等模块;为进一步提高对外部设备的控制精度,可引入辅助控制嚣模块。对系统各组成模块进行设计、比较和性能分析,可为整体系统的构建奠定基础,具有重要的研究意义。本文基于改进的单关节信息传输模型,针对解码器和辅助控制器投块设计、性能对比分
不断增加的智能设备已经成为用户在互联网上交流和互动的重要工具,因此智能设备的安全和隐私问题变得尤为重要。现有的用户认证方式(例如,密码、指纹认证、人脸认证等)均属于一次性认证,无法确保用户在使用过程中的合法性。基于行为特征的认证方式可以通过设备内置的传感器采集用户的行为数据,为用户提供连续、隐式的认证,确保用户在设备使用过程中的合法性。足部行为作为一种生物特征,比指纹、人脸、虹膜更具备难以模仿等特
在自动化高速公路环境下,高速公路系统可利用检测设备采集道路实时信息,再通过智能终端有效控制交通流。该系统主要包括驾驶员、车辆控制器以及道路基础设施等,为缓解因交通事件引发的交通拥堵提供了一种有效方法,研究意义重大。本文基于宏观交通流模型,针对控制器的设计与对比以及宏观交通流模型的改进等内容展开研究,具体如下:1.针对高速公路经常出现的交通拥堵问题,本文提出了一种基于宏观交通流模型的模型预测控制(m
石墨烯具有零带隙结构、低损耗性、动态可调性,在太赫兹吸收器应用中具有较高的实用价值。时域有限差分(FDTD)方法结合辅助差分(ADE)方法已经应用于太赫兹频段石墨烯吸收器的仿真分析中,但该方法需要采用极小的网格剖分石墨烯区域,导致其对石墨烯吸收器计算效率低。因此,提高计算效率尤为重要。本文在分析石墨烯相关理论和混合显隐式时域有限差分(HIE-FDTD)方法稳定性条件的基础上,采用ADE方法将太赫兹