基于YOLO网络的小尺度目标检测的优化技术研究

来源 :中国运载火箭技术研究院 | 被引量 : 0次 | 上传用户:liulaolv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测作为计算机视觉领域的一个重要研究方向,具有极高的学术理论价值和实际应用价值。随着人工智能和机器学习的发展,这一研究领域又被推向了新的高潮,衍生出了包括行为预测、目标跟踪等多项具有理论研究和实际应用双重价值的科研项目。然而在航空航天、军工安防和工业自动化一些应用领域中,常常会因为目标距离成像设备较远或者目标本身尺度较小,而导致收集到的图像中存在着许多的小尺度目标。这些小目标由于分辨率低、精度差、召回率低等问题,使得目标检测算法对它们的检测效果并不好。针对上述问题,本文提出了一种基于YOLO网络的小目标检测优化方案,同时在嵌入式平台上对方案进行了验证,本文具体研究内容如下:1.提出了一种新的小目标数据集扩展与数据增强方法并采用anchor自适应算法进行训练。首先将原始数据集中的图片按照图像中待检测目标照尺度大小划分为三个不同的等级。而后利用Mosaic数据增强算法的思想对划分后的数据集进行扩展,但是将大目标集合中放大操作的随机运算因子置为0、小目标集合中缩小操作的随机运算因子置为0。最后利用anchor自适应算法进行训练,使得不同尺度下的待检测目标所匹配到的anchors维持在同一个数量级。在MSCOCO2017、VOC2007和Vis Drone2019数据集上进行测试,小尺度目标的平均漏检率由32.1%降低为了23.5%。2.提出了一种针对嵌入式平台无人机对地小目标检测的优化网络。以单阶段目标检测网络YOLO网络结构为基础,以精度、速度和功耗三个指标作为评价标准,设计了一个针对嵌入式平台无人机对地小目标检测的优化网络。网络的Backbone部分采用了改进后CSPDarknet结构,在保证特征信息复用性的同时减少了计算的复杂度,提升了检测的效率。Neck部分采用特征金字塔结构,利用FPN思想保证了不同尺度的待检测目标的并行检测效果。Prediction部分采用解耦合操作,在保证实时性要求的前提下,以小部分检测速度为代价提升了网络对于小尺度目标检测的检测精度。在Vis Drone2019航拍数据集上进行验证,本设计的网络对于小尺度目标的检测精度由38.5%提升至43.8%,优于同系列的其他算法。3.在嵌入式平台上对实验结果进行验证,实现了对于图片、视频以及摄像头获取的场景中的小尺度目标检测的优化。
其他文献
<正>在国际贸易规则“绿化”发展趋势愈发明显的背景下,我国应密切跟踪关注美欧等大国低碳贸易规则进展,积极主动参与国际气变规则制定。同时,加快国内碳市场建设,适时征收碳税,为设置有利于我国的低碳贸易规则议题做好准备。
期刊
现代战争越来越趋于信息战,作为精确制导武器的导弹而言无疑具有强大的威慑力,其具有的超视距攻击、精确打击等特点使得战场环境越发复杂。对于高超声速导弹而言,其导引头多采用主被动复合制导的方式,在巡航阶段其主动导引头保持关机状态仅采用被动制导,在末端时采用主动制导从而锁定目标并发动攻击。在导弹高速飞行时,其与空气摩擦产生高温涡流,导引头天线罩内外表面存在温度差,高温还能导致罩体结构出现热烧蚀现象,这些因
学位
数据转换器作为连接模拟信号域与数字信号域的桥梁,在电子系统中扮演着非常重要的角色。其中,模数转换器用于实现对模拟信号的采样,并将其转换为数字信号,以便进行数据存储和处理,其分辨率、采样速率和能量效率等性能参数经常受到关注。近年来,随着航空工业、医疗影像设备等的快速发展,电子系统在这些场合的应用对高精度、大动态范围模数转换器提出了迫切需求。在各种架构类型的模数转换器中,由电容型数模转换电路、比较器和
学位
横腭杆是一种在正畸临床中应用广泛的固定矫治器的辅助装置。本文就横腭杆在正畸临床中的应用及其力学机制进行综述,为临床医师提供参考。与传统观念不同,单独使用横腭杆并不能有效加强支抗,将其与其他传统支抗加强装置联合使用可以在某些情况下提供充足的支抗。同时,横腭杆可以辅助唇侧固定矫治维持牙弓宽度,辅助排齐牙列,纠正不良习惯,使矫治效率得以提高,副作用减少。用作主动矫治装置时,横腭杆可以使单侧或双侧磨牙在三
期刊
在建设工程市场环境中,经常会遇到投标不完善的情况,给整个建筑行业的发展造成了严重的影响。文章全面分析了建设工程市场投标经营的具体情况,找到问题之所在,深入研究了今后建设工程投标的特点,并提出了合理的投标经营决策意见,为今后同类型工程投标提供信息参考。
期刊
6D姿态估计作为增强现实,自动驾驶,机器人抓取等领域的关键技术之一,是一项极具挑战性而又基础的任务。现存的方法大多依赖于深度图像或迭代调优来追求先进的结果。然而,深度图像的获取成本高,迭代调优过程严重影响模型实时性。本文研究在不需要任何迭代调优过程的条件下,利用单目RGB图像进行实时的高精度的6D姿态估计。基于向量场表示的姿态估计方法能自然地解决目标遮挡问题并实现最先进的性能。该类方法利用不可微分
学位
水泥企业原材料水分一般在2%~15%,特别是粒度较小的细料,即便是水分不高,也容易在料仓下料口粘结在仓壁上,越粘越多,最终将下料缩口堵塞,造成工序断料,不得不停机处理。特别是到雨季,这种现象屡见不鲜,下料口一旦堵塞,就需要停机处理0.5~2.0h,而且,因为下料口位置的原因,考虑到计量秤的精确度,往往是有人也得不到多人分工处理,只能少人轮换处理,处理时间长,影响主机运行。所以,通过技术创新,设计一
期刊
利用电磁波对人体的生命体征进行非接触式检测在近些年来引起了学术界的广泛重视。目前常用的生命体征检测手段都是接触式的,这使生命体征检测非常不便捷。生命体征探测雷达凭借其在不接触被测试者的条件下,就能获取被测试者的生命体征的特点获得了越来越多人的青睐。非接触式生命体征探测雷达在监测老年人健康状况、地震火灾救援和城市反恐等领域有着良好的应用前景。本文围绕生命体征探测雷达开展研究工作,利用多普勒效应设计出
学位
随着现代电子和通信技术的快速发展,解锁了多样化的无线系统,传统阵列在一定程度上已经无法满足各种相互制约的性能需求,学术界开始探索同时兼顾低成本、多功能、高性能和高适应性的新型阵列天线技术。在这样的技术背景下,新体制阵列天线技术应运而生。新体制阵列天线是在传统阵列天线的基础上,引入新的自由度,例如极化控制、时间控制和频率控制等,从而在一些复杂应用上代替传统阵列天线。以此为背景,本文对四维阵、频控阵以
学位
<正>山东省临沂市地处沂蒙山区。四季分明,日照充裕,无霜期长的暖温带季风区大陆性气候、良好的生态环境造就了这片地域成为果树栽植的优势区。截至2021年,全市园林水果面积9.31万hm2,产量314.43万t,分别占全省的14.94%和16.61%,面积和产量常年维持在全省市级第2位水平,是中国重要的落叶果树集中产区。但近些年果园比较效益下降,随着劳动力成本的逐步提高,果园管理受到影响,果园土壤面临
期刊