【摘 要】
:
当前基于深度学习的主流目标检测算法根据处理策略可以大致划分为两大类别,分别为以R-CNN系列为代表的两阶段目标检测算法以及以YOLO系列为代表的单阶段目标检测算法。早先的单阶段目标检测相比双阶段目标检测在速度方面有明显的优势,但是识别精度要低一些,但是随着YOLO系列的不断更新优化,到YOLOv5时无论是模型的精度还是速度,其优异的性能备受关注。YOLOv5算法作为目标检测领域最具影响力的算法之一
论文部分内容阅读
当前基于深度学习的主流目标检测算法根据处理策略可以大致划分为两大类别,分别为以R-CNN系列为代表的两阶段目标检测算法以及以YOLO系列为代表的单阶段目标检测算法。早先的单阶段目标检测相比双阶段目标检测在速度方面有明显的优势,但是识别精度要低一些,但是随着YOLO系列的不断更新优化,到YOLOv5时无论是模型的精度还是速度,其优异的性能备受关注。YOLOv5算法作为目标检测领域最具影响力的算法之一,本文将以其为对象进行模型轻量化研究,以降低模型对硬件资源的算力要求,并针对YOLOv5算法在训练模型时可能出现的数据不均衡问题,分析不同类型的数据不均衡问题各自产生原因进行优化。本文旨在设计出更加高效、高性能的目标检测网络。本文主要完成了以下工作:(1)本文结合现有的模型轻量化经验以及YOLOv5的网络结构特点,提出了五种不同的瓶颈层结构以替换YOLOv5中对应的原始结构,充分利用了高效神经单元的设计模式。在保证除了瓶颈层以外结构都一致且所有超参数都相同的前提下,设置了多组不同瓶颈层结构的对比实验且所有实验都基于COCO数据集,实验结果表明IBN、Tucker、SEGBottleneck以及Split IBN都能达到良好的模型轻量化效果,参数量分别降低了25.1%、23.1%、21.2%和14.2%。其中Split IBN综合效果是最佳的,不仅能够实现模型轻量化,对模型的精度也有一定提升,平均准确率提升了0.4%。(2)在目标检测领域除了卷积神经网络结构本身影响着最终模型的性能以外,保证目标检测网络的数据均衡也是至关重要的。为了解决四类数据不均衡问题,即空间不均衡、类别不均衡、尺度不均衡和目标不均衡,本文通过研究分析各自产生的原因,分别采取相应的方法解决。针对空间不均衡和目标不均衡,本文通过引入最新的Focal EIo U损失函数来解决。通过调节Focal Loss的超参数以解决类别不均衡,并根据类别不均衡的特点提出实际应用时如何选择模型训练策略。针对尺度不均衡问题,本文通过借鉴Bi FPN的设计思想对原始的Neck层即PANet结构进行改进以解决。分别在原始的Neck结构P4、P5上增加一条和两条特征信息流(Neck-Bi FPN1和Neck-Bi FPN2),实验表明Neck-Bi FPN1效果最佳,其参数量增加了0.9%,平均准确率提升了1%。(3)本文考虑实际部署目标检测模型时,在目标检测网络结构设计完成后为了更加及时更加简便代价更小得实现后续的优化工作,从激活函数和模型的训练策略方面进行研究。不同的激活函数对目标检测网络提取特征的效果不同,且不同平台计算不同激活函数的复杂度也不同,比如Si LU在移动设备上计算sigmoid是需要很大代价的,通过多种激活函数对比实验发现Hard Swish的效果与Si LU是接近的,但是其计算复杂度要低得多。通过不断迭代更新预训练模型可以在保证目标检测网络一致的前提下能够实现更快的模型收敛效果。
其他文献
近年来,我国北方臭氧(简写“O3”)污染情况出现向夏季末延伸的趋势.为合理、有效地治理北京地区O3污染,现于北京南部地区(大兴新城地区)设立监测点位,观测与分析2019年夏季末O3及其前体物的浓度分布特征与气象条件,得出北京南部地区夏季末在温度升高、风速和湿度不宜过大条件下更加容易出现O3浓度超标情况.利用特征比值法与EKMA曲线法共同判断出该地区夏季末以挥发性有机物(简写“VOCs”)控制区为主
针对目标检测网络参数量冗余、模型复杂、推理速度缓慢以及难以部署在资源受限的嵌入式设备等问题,提出一种融合剪枝与量化的目标检测网络压缩方法。首先对目标检测网络模型进行稀疏化训练得到缩放因子,并根据缩放因子的分布计算卷积层中通道重要性的占比,根据缩放因子计算动态阈值将对网络模型贡献小的卷积层剪除。然后通过均匀映射的方式将32位浮点型数据量化成8位整型数据,减少网络计算量的同时压缩网络模型的大小。最后采
近年来,房地产开发行业逐渐扩张,在激烈的市场竞争下,房地产企业的经营往往以利益最大化为先,但由于其自身税种多、税额大、清算复杂,纳税筹划成为影响房产收益的最大问题。本文深度分析房地产开发税制的基本特征,简要分析各阶段涉税情况和筹划的必要性,并从决策、开发、销售、清算四个阶段详细分析纳税筹划及对应的方案,以期进一步加强税收管理,降低风险,立足于全局,实现价值最大化。
目的探讨血清和尿液转铁蛋白(Tf)水平与糖尿病肾病(DN))的关系,为临床上DN的诊治探索新的生物学标记物。方法(1)选择兰州大学第一医院内分泌科2019年10月-2020年12月收治的170名2型糖尿病(T2DM)患者为研究对象,同时选取我院体检中心选取30名健康体检人员作为对照组(HC)。根据DN的严重程度,T2DM患者分为正常蛋白尿组(NO)、微量蛋白尿组(MI)、大量蛋白尿组(MA)、肾功
于2020年7月至2021年6月,在郑州市3个城市站点和1个郊区站点开展逐月大气VOCs离线样品采样及实验室分析,探讨郑州市大气VOCs体积分数水平、组成特征、反应活性和来源贡献.结果表明,观测期间,郑州市大气φ(VOCs)为(37.50±14.30)×10-9,组分占比为:烷烃(33%)>OVOCs(24%)>卤代烃(23%)>芳香烃(8%)>烯烃(7%)>炔烃(4%)>硫化物(1%).季节变化
针对通用的目标检测算法在检测生活场景下的多类目标时检测精度低、速度较慢的问题,提出了一种基于注意力机制改进的轻量级目标检测算法YOLOv4s。该算法以CSPDarknet53-s作为主干特征提取网络提取图像特征,通过注意力模块进行特征选择,再利用特征金字塔网络对特征进行融合,最后通过检测头分别处理特征融合后的两个输出,进而提高对生活场景下多类目标检测的能力。实验结果表明:相比改进前的算法,YOLO
为了提高传统SSD算法对小目标检测的准确率,提出一种改进的SSD目标检测算法:采用基于可变形卷积的ResNet50作为SSD算法的特征提取网络,提高对目标的处理能力;设计特征金字塔(FPN)来融合不同层的特征图,丰富浅层特征图的语义信息;在特征融合时引入通道注意机制,提取相应的通道权重,增加重要信息的比例,提高检测效果。最后采用PASCAL-VOC2007开源数据集进行仿真实验,并与传统SSD目标
目标检测作为计算机视觉的重要分支而备受人们关注。现有的检测方法普遍模型尺寸较大,设备要求高,难以用于移动端或嵌入式设备中实时处理。因此,本文利用MobileNetV3结合SSD的轻量级网络,再加入双向特征金字塔模型对特征进行融合,以此提高网络的准确率。实验结果表明,加入双向特征金字塔的轻量级目标检测网络在Pascal VOC数据集上mAP达到了73.65%,比单独的MobileNetV3-SSD目
针对道路目标检测中行人目标检测效果不佳的问题,提出了一种改进型SSD行人目标检测算法。首先,采用具有噪声的基于密度的聚类方法(DBSCAN)结合K-means算法选取适当规格的Anchor Box,使用DBSCAN剔除样本干扰点后利用K-means确定聚类中心,根据重叠度选择适当规格的Anchor Box;然后,对SSD算法的各个特征图进行尺度不变的卷积操作构建语义信息增强的特征图,并将原始特征图