基于密集检测框架的小目标检测研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:houtou27
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测作为计算机视觉基础任务,广泛应用于人脸识别、无人驾驶、无人机视觉应用等各个领域。近年来通用目标检测成绩显著,但其应用锚框机制难以捕获充足的小目标样本,大量的超参数又使得网络难以训练。密集检测器对任意尺度目标具有良好的鲁棒性和泛化力,应用于小目标检测具有较大的潜力。然而目标尺度小、分辨率低,模型训练过程中存在多种不平衡,特征凸显困难,在以下几个方面存在明显不足:1)标签分配:密集检测器以固定标注框占比选取正标签,小目标标注框小,获得的样本量少,极易导致大小目标样本不平衡。2)特征提取:低层网络能提取丰富的空间细节信息,但感受野小,语义信息少;现有高低层特征融合方法会导致特征不对齐,影响特征表达。3)特征增强:小目标信噪比较低,特征表达弱;已有研究表明注意力机制利于特征增强,但计算开销较大。4)损失函数:小目标对总损失做出贡献较小,模型难以学习充分的区分性特征;已有研究应用投票策略增加小目标学习,但其性能依赖于训练数据。本文采用密集检测框架,解决训练过程中存在的不平衡问题,并增强小目标的区分性特征表达,主要工作包括:1)提出可伸缩标签分配策略。设计可伸缩的椭圆框,以自动调整目标标签分配区域,获得更多的小目标样本。2)设计低层残差特征提取网络。以低层空间细节信息为主,借助相邻上层语义信息辅助表征小目标。3)提出特征引导增强模块:设计两个非线性学习算子引导模型学习更多的小目标区分性特征,在此基础上使用全局平均池化增强其特征表达。4)提出尺度感知损失函数:利用目标尺度的统计信息,动态加权小目标的损失,增加模型对小目标的关注。在多个数据集上进行广泛实验验证,结果表明与基于密集检测框架的先进目标检测器和基于锚框的目标检测器相比,本文提出的模型在小目标检测上均有卓越的性能优势。
其他文献
作为第三代有机电致发光材料,热活化延迟荧光材料(TADF)中三重态激子能够通过反系间窜越(RISC)转化成单重态激子,从而参与荧光发射,理论内量子效率(IQE)达到100%。其相较于传统荧光和磷光材料而言,器件发光效率较高,生产成本较低,故而吸引了全世界的目光。当前TADF材料亟需解决的问题之一是效率滚降,而研究发现:提升反系间窜越速率(kRISC)会缩短延迟荧光的寿命,有利于抑制效率滚降;给受体
学位
当前,每天都有数以亿计的图像和视频被上传至网络供人使用。但是,受拍摄时电子设备内部硬件条件或外界自然环境等因素的影响,可能导致图像的清晰度不佳。并且,由于显示器的分辨率不断提高,人们对图像和视频清晰度的要求不断增加,如何快速且有效地提升视频的分辨率成为一个日益重要的问题。超分辨率技术是解决这一难题的主要方法之一。视频超分辨率的目标是利用多帧低分辨率视频帧恢复高分辨率视频帧,相关成果可以广泛应用于高
学位
分辨率是一种用来衡量影像清晰度的概念。高分辨率的影像能够展现出更多的细节纹理,提升影像的质量和观感。为了满足获取高分辨率影像的需求,超分辨率算法被广泛且成功地应用在多个领域当中。目前,基于深度学习技术的超分辨率算法能够在有限的硬件设备条件下提高影像的分辨率。视频序列作为多个按时间顺序排列的图像帧,如何挖掘其中蕴含的丰富特征信息显得尤为关键。多帧视频的特征信息主要包括单个视频帧本身的空间信息,以及该
学位
随着微服务架构的快速发展,大量微服务使得服务管理复杂度和运维成本陡然提升,需要通过服务治理提供多种服务基础设施,从而提高微服务管理效率、降低企业运维成本,同时确保微服务的运行质量。Kubernetes是当前使用最广泛的容器编排系统,通过容器技术可以标准化管理微服务,可为实现微服务灵活扩展,高效维护提供基础支撑。本文基于Kubernetes设计并实现了微服务治理平台,并着重对Kubernetes调度
学位
碳-氟(C-F)键的键能很高,导致其反应活性较低,很难在常规条件利用过渡金属配合物进行活化,这是有机合成化学领域目前面临的一个很大的挑战。近年来,利用过渡金属催化氟代芳烃实现各种C-F键活化是化学领域的前沿研究课题。尽管当前已有多种较为先进的分析检测技术,然而,由于反应条件较为复杂,可能性路径较多,一些关于机理的细节仍然较为模糊,这些都一定程度的限制了后续的实验拓展研究。值得注意的是,近些年理论化
学位
社区结构是复杂网络的重要特性之一,寻找网络中潜在的社区结构,在用户推荐、舆情监控、公共安全等方面有重要的应用价值。基于层次聚类的社区发现算法是寻找社区结构的经典算法,可以发现复杂网络多层次的结构特征。但是现有的层次聚类方案存在局限性,采用模块度最优的单步贪婪策略,只考虑节点的一阶邻居信息,影响社区发现结果的准确性。其次,模块度作为层次聚类的目标函数和评价方法,存在分辨率限制(Resolution
学位
近年来,区块链技术在各行各业得到了广泛应用并快速发展,传统的区块链框架性能低下的问题也随之暴露,比如在公有链领域,比特币的TPS约为5笔/秒,以太坊的TPS也在13-15笔/秒之间,在面对绝大部分业务场景时,传统的区块链框架性能都难以满足实际应用需求。联盟链是由多个组织在一个去中心化的网络上合作,具有更好的性能。如何有效整合公有链和联盟链,开展数据协同从而提升公有链性能有待研究,加之当前区块链框架
学位
在能源与环境问题日益突出的时代背景下,开发可再生能源,成为实现“碳中和”目标的重要一环。稻壳是一种产量巨大的农业废弃物,目前一般通过焚烧处理,这样的处理方式既损害了周边地区的空气质量,又造成了自然资源的浪费。近年来,以稻壳为原料制备的木质纤维素基多孔炭因成本低廉,孔道丰富的优势吸引了众多研究者的关注,被广泛用于储能器件的电极材料,特别是超级电容器。然而,稻壳炭在活化过程中会引入大量的含氧基团造成严
学位
一氧化碳(CO)是工业烟气中的重要污染物之一,随着排放政策的日趋严格,CO等污染物的排放浓度限值不断降低,对设计制备适用于工业烟气中CO氧化消除的催化剂提出更高要求。贵金属催化剂因其较高的活性和稳定性在低浓度CO氧化消除中一直受到广泛重视,近年来,Pt基催化剂在常温常湿CO氧化反应中获得较大进展。但在工业烟气中,即使经过脱硫处理,残留的微量SO2仍然容易导致Pt基催化剂失活,严重制约着其在工业烟气
学位
受益于无人机的灵活性、安全性和低成本,低空无人机目标检测技术广泛应用于动植物保护、测绘和监控等领域。较之普通视频监控,低空无人机航拍场景复杂,摄像头距目标较远,导致目标模糊,目标信息表达不足,误检和漏检的情况严重。现有目标检测方法存在诸多不足,难以应对目标模糊挑战,具体包括:1)由于模糊目标的边缘细节信息缺失,模型难以从少量的边缘特征中获取准确的定位信息,影响定位精度。2)模糊目标的外观信息不足,
学位