面向小目标的YOLOv5改进算法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:w11122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测需要在大量自然图片中通过预定义的标签中准确的找到目标物体,是计算机视觉的重要研究方向,在如工程安全着装、行人和车辆检测等领域有巨大的应用价值和研究前景。工程安全着装、行人和车辆检测中大部分的目标尺寸都较小、多背景噪声,目前的目标检测算法对于这类小目标的检测能力比较有限。小目标指的是在图像中的像素占比少的目标物体,小目标易受背景噪声影响和特征不足的问题会导致小目标识别困难。本文选取YOLOv5作为主要研究对象,就小目标在目标检测中的难点展开分析,针对小目标检测的问题设计改进方案来提升YOLOv5的检测性能。具体内容如下:(1)针对小目标像素低、占比小的特点,考虑YOLOv5是一个anchor-based模型,Anchor机制通过设计更符合数据集中的目标、尺度和长宽比不同的锚框以覆盖尽可能多的有效感受野来提高检测的精确度。但YOLOv5的原Anchor机制存在一定的缺陷,其中分配标签以及NMS都是依赖Io U作为度量,于是考虑了将Normalized Wasserstein Distance(归一化Wasserstein距离,简称NWD)作为度量替代Io U以解决Io U对于小目标偏差非常敏感的问题,最终获得更加符合如安全帽、航拍中的行人和车辆等小目标的锚框值来提高整个模型的性能。(2)针对卷积神经网络本身存在的多次下采样导致的细节信息丢失,以及小目标特征不明显、容易受背景噪声影响的问题,本文利用注意力机制融合多尺度网络结构增加浅层的特征图语义信息和深层特征图的细颗粒信息,主要是采用了ECAnet以一维卷积的方式捕获跨通道信息来增加目标区域的特征信息,结合Coordinate Attention将空间信息编码成两个并行的一维特征码,用以捕获长期依赖和保留位置信息,最终强化目标兴趣表示,提高算法的目标分类能力和检测的精确度。同时,因为浅层的特征图所包含的语义信息更丰富,于是引入Up Sample模块进行上采样操作以捕获更浅层的特征图从而保留更多的小目标细节以提高检测性能。本论文选取了两个不同的数据集进行实验,一个是工程安全着装,做安全帽以及反光衣的图像识别,这个数据集的特点是目标物体尺度大部分偏小,在图像中的位置比较零散和稀疏;另一个是无人机航拍图像的行人、车辆目标识别,其中图像中目标物体尺度小且密集、遮挡物多是它的特点。这两个数据集都是小目标数据集,但是各有不同,通过在不同数据集上进行实验,可以验证改进方案的有效性,并且能够分析改进方案在不同特点的数据集上的不同表现,更好地理解改进方案对于模型性能的影响。最终,通过在这两个数据集上的对比和消融实验证明了改进方案对于模型性能的提高。
其他文献
近年来,全电推进舰船成为海军的热门话题。所谓全电舰船,就是舰船的动力系统以电传动装置为主体的舰船。也就是说,全电舰船的原动机(柴油机、燃气轮机或核动力)发出的全部功率均用于带动发电机发电,这些电力再由舰船综合电力系统进行分配,或是给电动机组带动螺旋桨发电,或是供舰上的武器、电子系统使用。电力传动和机械传动是舰船传动装置的两大门类。时至今日,机械传动的舰船仍是各国海军的主流,但随着基础技术的发展,以
期刊
国有企业的性质和地位决定了其面对外部不确定因素带来的经营风险时缺乏敏感性,这反映到现实中体现在企业内部出现的成本粘性现象。在当前的竞争环境中,企业利润及经营成本约束影响着企业的发展进程,因而聚焦于企业成本管理,认识和管控企业成本粘性显得十分重要。随着混合所有制改革的实施,国有企业中国有资本与非国有资本交叉持股、融合程度逐渐加深,国有企业混合所有制改革进程继续加快和深化。这使得企业股权结构发生变化,
学位
产业的发展壮大离不开政策的保驾护航,大数据产业政策是推动大数据产业高质量发展的重要保障。作为我国首个大数据综合试验区,贵州先行先试,大力推进大数据发展,承载国家“东数西算”重大战略,成效显著。对当前政策进行系统梳理和科学评价,对今后政策的优化和制定具有重要作用。本文以大数据产业政策为研究对象,梳理2014~2021年贵州省、第二批试验区以及国家层面大数据产业政策文本。借助文本挖掘软件提取关键词并绘
学位
对企业而言,国际化扩张是一把双刃剑,在为企业带来潜在收益的同时也加大了企业在扩张过程中的运营与管理难度;加之国际形式瞬息万变,类似全球金融危机、新冠肺炎疫情等突发事件的爆发和传播使企业陷入了困境。在面对不确定性和极具挑战的国际环境时,探究什么样的领导者能够克服困难实现成功是值得关注的。本文瞄准领导者心理韧性这一心理因素,基于其克服逆境并迅速恢复的特征,厘清其是否对于企业国际化成长具有重要作用。通过
学位
城市滨水空间研究历经多年,现今在存量发展时期亟待优化,它是我国生态文明建设的重要环节。盘龙江是昆明市最重要的河流,是进入滇池流量最大的河道,近年来昆明市对盘龙江的水质和河岸景观等进行了持续的综合治理并取得了卓越成效,但其滨水空间仍存在景观生态空间功能错位、景观特色不突出等问题。通过文献研究与田野调查,从生态系统服务供需理论出发,将盘龙江中心城区段滨水空间划分为28个研究单元,构建生态系统服务供需评
学位
在21世纪中国,人力资源随产业转移升级和交通基础设施快速完善而流动的趋势愈发明显,受不同区域文化潜移默化影响而拥有不同文化价值取向的企业员工汇聚一堂,这使得文化价值取向多元化团队的内部沟通问题成为企业管理的焦点问题。因此,本文以员工文化价值取向为出发点,探讨企业员工文化取向差异对沟通满意度的影响,并基于管理心理学的研究,验证共情能力对员工文化价值取向与沟通满意度的中介作用,以期对企业组织沟通和人力
学位
该笔译实践项目来源于《走向数字诗学—电子文学与文学游戏》的第一、二章,旨在探索文学类丛书的翻译策略。节选章节主要探讨了数字时代的变化以及由此发生的更深刻的文化巨变。同时书中聚焦到电子文学,并研究电子文学的定义,引发了社会对于电子时代与数字文学的界定并探讨如何对待新事物。通过分析源文本的语言特征,笔者意识到该文本属于科技-文学类文本。该类文本通常用词准确客观,专业性较强,主要用于传递信息及观点,在翻
学位
随着可再生能源的广泛应用与电动汽车的产销量增长,传统的发电用电主体显著变化,这种发电用电的主体的转变对电网架构与供电方式提出了新的要求:由集中式发电转向分布式发电,由绝对不变的供电用电主体转向相对可变的供电用电主体。为应对上述变化,不仅需要加大新型微网投资建设力度,而且需借助计算机技术实现对微网与主网的配合调度。本文以工业园区微电网为背景,对园区微网内不同设备之间的配合运行策略进行研究,旨在实现园
学位
在全球化的背景下,地域性也许是这个时代最不可或缺的特性之一。全球在地这一对矛盾无时无刻不在推动着世界发展,如何处理这一对矛盾的关系是当代建筑师应该思考的问题。云南得天独厚的生物多样性和与众不同的风土文化无疑是云南地域性建筑设计取之不尽的灵感来源,从中提取一种具有代表性的特质作为研究对象,或许能为云南地域性建筑研究提供一些思路。云南地域性建筑的“野性”来源于云南省多样的原生文化与自然观念之中,充分挖
学位
乡村振兴是我们国家关注的热点、重点问题,相比于城市,乡村的营建更多的是被动式适应的一种营建模式,这种被动式适应表现为村寨选址的被动式适应、村寨公共空间的被动式适应和建筑空间的被动式适应。傣族地区的被动性适应有着独特的空间特征和内涵,有着很强的地域性特征。研究以傣族村寨公共空间为主要研究对象,通过多个村寨的实地调研走访、案例地微气候实验设计、问卷调查、软件模拟等多种研究方法对科学问题进行了深入的探讨
学位