适宜于小目标检测的鲁棒算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:gjx0128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于小目标具有尺寸小、分辨率低的特点,一直以来是目标检测任务的难题。小目标的识别不能单纯使用一个尺度的特征图预测,需要针对小目标的特点设计合适的检测模型,利用全局语义信息和多尺度特征图进行识别。本文从特征增强的角度出发,提出了新颖的特征融合模块、注意力模块、特征金字塔模块,并将这些模块应用到经典的检测模型中,以提升小目标检测的精度。如下为本文针对提升小目标检测精度做的三个主要工作:1)第一个工作是设计了一种新颖的注意力模块,以提升特征图的表示能力。该模块在建模通道间关系的同时,捕获全局的语义信息,弥补了卷积操作仅能捕获局部特征的缺点。借助全局语义信息,结合小目标所处的环境提升其识别效果。在PASCAL VOC数据集和RSOD遥感卫星数据集上设计了丰富的实验验证了该模块在不同检测模型上的提升效果和泛化能力。2)第二个工作是对SSD(Single Shot Multibox Detector)目标检测算法的改进以提升其对小目标的识别能力。SSD算法在进行多尺度预测时存在特征图信息不平衡问题,为了进一步提升SSD算法的检测性能,本章设计了即插即用的模块来增强特征图的表示能力。首先,设计了一种新颖的特征融合方法来解决跨尺度特征融合存在的信息差异问题。其次,根据池化金字塔的思想设计了一种深度特征提取模块来提取不同感受野的信息,从而来提高对目标的检测能力。最后,利用所提模块改进了SSD算法的架构。通过上述机制,有效提升了SSD算法的检测精度和鲁棒性。在PASCAL VOC数据集上设计了丰富的实验,验证了所提方法的有效性,其中,在PASCAL VOC2007测试集上本章方法比SSD算法提高了2.9%的精确度,同时还保留了实时检测的能力。3)第三个工作是对FPN(Feature Pyramid Network)模块的改进以进一步增强特征金字塔的信息融合能力,提升小目标识别精度。FPN自顶向下的融合方式导致浅层特征图丰富的信息无法有效传递到深层特征图,造成了特征图信息的不平衡。此外,FPN直接融合两个存在信息差异的特征图容易引入噪音信息,不利于小目标的检测。为了解决这两个问题本章提出了DFFPN网络(Deep Fusion Feature Pyramid Network),利用条件卷积提取两个特征图的共有信息作为模板,后续基于模板特征图融合,可有效减少噪音信息的引入。为了增强信息的传递能力,采用交叉残差链接的方式克服了自顶向下融合方式的单向信息流问题。最后,将所提深度特征金字塔模块分别应用到一阶段检测模型和二阶段检测模型并在多个数据集上进行了实验,其中基于Faster-RCNN的模型在RSOD遥感卫星数据集上平均检测精度提升了2.4%,基于Retina Net的模型提升了2.3%。
其他文献
机器学习尤其是深度学习技术促进着现代医学的发展,在很多疾病的诊断过程中起到了重要作用。传统机器学习方法需要大量的数据来训练算法模型,而在智慧医疗领域,由于数据的来源涉及患者隐私,很难获取海量的生物医学数据进行公开研究,这给机器学习技术在该领域的应用带来了诸多挑战。在该背景下,本文主要结合EEG脑电癫痫信号和新冠肺炎肺部CT图像这两种生物医学数据的自动诊断问题,开展面向生物医学数据的小样本分类方法研
学位
点云的特征检测是点云数据处理中最基础也是最重要的一个环节,数据处理中的多数算法都与点云特征提取有一定的关联,例如:点云的配准、分割、曲面重建、重采样等。其中,点云配准技术在计算机视觉中起着举足轻重的作用,并且广泛应用于三维重建、目标识别与跟踪、智能机器人等领域,具有重要的研究价值。传统的基于点特征的点云配准技术,无法保证对应关系的准确性和效率。随着对测绘成果的要求不断提高,对配准技术的要求也随之提
学位
环状RNA(circ RNAs)-RNA结合蛋白(RBPs)结合位点在许多生物过程中起着重要作用。因此,研究RBPs在circ RNA上的结合位点是至关重要的。虽然基于传统机器学习和深度学习的方法已被用于预测circ RNA与RBPs之间的相互作用,但对已有算法还未能充分学习circ RNA的相关特征,也未能进行高效的协作学习。针对上述问题,本文研究两种用于circ RNA-RBP结合位点的识别方
学位
服装解析由于其在时尚合成、姿态估计等领域的广泛应用而受到越来越多的关注。随着卷积神经网络的快速发展,现有的服装解析方法在卷积神经网络技术的帮助下也取得了优异的性能,极大地推进了服装解析任务技术的研究和应用。但是由于人体形态多变、服装类别多样、目标对象尺寸差别大以及对象边缘模糊等特点,现有的服装图像解析方法很容易产生错误解析结果,特别是在一些相似和细小的服装类别上。同时卷积神经网络自身也存在重复的下
学位
互联网的飞速发展以及信息采集、分享方式不断丰富促使人们步入大数据时代,数据的急剧增加带来严重的“信息过载”问题,推荐系统便是针对这一问题所提出的,推荐系统分析用户的行为记录,挖掘用户的个性化需求,帮助用户找到他们感兴趣但很难被发现的产品。如今网络内容日益丰富,物品数目动辄百千万计,用户交互数据非常稀疏,导致大多关联分析算法效果一般;由于新用户、新物品可供分析利用的信息较少,很难给出精准的推荐,从而
学位
文本情感分析是自然语言理解的热门研究方向,是对含有情感信息的文本数据进行分析、处理和总结。传统的文本情感分析方法需要人工构造特征,耗费大量的人力和时间,比如传统情感词典分析方法。而机器学习算法对文本进行情感分析时,出现发掘信息不完整,获取文本数据特征稀疏的情况,例如循环神经网络。近些年,深度学习技术在自然语言理解领域取得了显著成绩,一定程度上能有效克服传统方法和机器学习的缺点,因此本文基于深度学习
学位
在弱光环境下拍摄的照片中,由于光照条件不充足,通常会导致生成的图像产生大量的噪声、颜色退化、低对比度和曝光不足等严重的问题,这不仅使得图像的可视效果难以接受,同时也丢失了许多细节信息。这种情况也对其他计算机视觉任务产生了严重影响,如目标检测、人脸识别、水下图像成像以及视频监控等。针对这些问题本文主要从缺失信息的恢复和光照场景的自适应两个角度进行了下列研究:1)由于低照度图像中通常含有严重的噪声,导
学位
在欣赏书画艺术作品时,观赏者可以从作品的静态笔触中感受到暗示性的运动,并且大脑中会对其感受到的运动进行无意识的运动模拟。这一心理现象在各种艺术文献中有着广泛的记载,并被归类为“具身美学”的重要感知模式之一。在实验美学中对这类审美现象有相关研究,但这些研究仍停留在审美偏好和脑神经活动方面,过去的研究和实践既没有尝试从大脑中获取想象的笔触运动的“数据”,也没有尝试在此基础上以新的形式重新创作艺术品。目
学位
文本情感分析研究人们在文本中表达的情感、观点、态度。细粒度情感分析是其中的一个细分领域,相比于研究文本整体情感的粗粒度情感分析,细粒度情感分析直接对文本中的实体进行情感分析,具备更多的实用价值。细粒度情感分析的目标是提取出文本中实体,并对根据句中观点对每个实体的情感倾向进行分类。按提取的项目不同,其可以分为方面项抽取、观点项抽取及方面情感分类三个子任务。本文主要研究方面情感分类和结合三个子任务的方
学位
近年来,癌症患者越来越多,并且癌症的死亡率也在不断增加。对于大多数癌症患者来说,传统的物理和化学治疗方法不仅昂贵而且效率不高。此外,一些抗癌药物在杀死癌细胞的同时也会损害正常细胞,患者长时间服用这些药物会使癌细胞产生耐药性。因此,迫切的需要开发新的更加有效的药物。而多肽作为一种高特异性、选择性和对人体伤害小的安全可靠的治疗候选药物,近年来备受研究者的青睐。随着多肽药物数据的增加以及机器学习算法的快
学位