基于自适应聚焦损失的图像目标检测

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户：xxssdd55

【摘要】

：

【作者】

：

孔祥旭

【机构】

：

辽宁工程技术大学

【出处】

：

辽宁工程技术大学

【发表日期】

：

2023年01期

【基金项目】

：

辽宁省教育厅科学技术研究项目（LJ2020JCL023）；

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于深度学习的目标检测方法,存在由现有目标检测框架引起的正负样本不平衡和训练数据引起的难易样本不平衡问题。现有方法一般采用基于类别频率的重采样或基于类别预测概率的重新加权,虽然减轻了类别的不平衡问题并能够有效提高目标检测的精度,但是引入了新的超参数,为每个训练任务进行大量的手动调整超参数需要高昂的实验成本。针对这一问题,在现有Focal Loss损失函数基础上提出了一种自适应聚焦损失（Adaptive Focal Loss）的目标检测算法,使模型聚焦于对训练过程贡献更大的困难样本,并且可自适应的调整超参数。首先,根据训练过程中每批图像标签中的正负样本数量计算出自适应的加权因子来实现对正负样本的动态平衡。其次,根据训练过程中不同阶段各类真实标签的期望概率计算出自适应的调制因子来自适应地平衡难易样本。最后,将目标检测在原有Focal Loss损失函数上分别添加自适应的加权因子、自适应调制因子以及两种因子相结合的Adaptive Focal Loss。为验证三种方法的有效性,做了多组对比试验。实验在PASCAL VOC2007和PASCAL VOC2012两个数据集上分别进行了纵向和横向的比较。只添加自适应加权因子情形,实验在PASCAL VOC2007测试数据集平均精度均值达到78.86%,相比较于原算法提高1.56%。只添加自适应调制因子情形,实验在PASCAL VOC2007测试数据集中平均精度均值达到79.61%,相比较于原算法提高2.31%。对于本文提出的Adaptive Focal Loss,实验在PASCAL VOC2007测试数据集中平均精度均值达到80.75%,相比较于原算法提高3.45%,而在PASCAL VOC2012测试数据集中平均精度均值达到77.17%,相比较于原算法提高1.87%。实验结果表明,把Adaptive Focal Loss作为网络的损失函数,通过自适应调节超参数的方法有效改善了正负样本不平衡和难易样本不平衡问题,相比于原始的Focal Loss损失函数检测精度有所提升,并可以适用于多种不同的网络模型,具有较大的实用价值。该论文有图23幅,表6个,参考文献79篇。

其他文献

车载前视摄像系统的研究与应用

随着全球经济的发展和科技的进步,高级驾驶辅助系统与车联网等技术在不断地积累、沉淀。如今,国内汽车年销量超过千万辆,因此这些新兴技术在中国的汽车市场里获得了新的发展动力和机遇。随着成像技术的发展和应用,基于视觉系统的高级驾驶辅助系统成为汽车发展的主流趋势之一。车载视觉系统包括车载前视摄像系统、倒车影像系统、360°全景影像系统以及车内监控摄像系统等。其中车载前视摄像系统的功能主要有两种:一是用于记录

学位

单敏感方向惯性组合双轴转动机构整体标定方法研究

技术的进步总是和社会的发展密不可分的,社会的发展促进技术的提升,技术又反哺于社会,为社会提供极大的方便。在当今的生活中,惯性导航技术广泛应用于车辆、舰船、飞机、导弹、卫星、宇宙飞行器甚至小型设备（PDA,智能手机）等各种平台上,其在民用和军事等重要领域发挥着不可替代的作用。为了提高导航精度,常规的方法是从加工、工艺和材料等方面着手,但从当今的制作技术上来看已经到达瓶颈,所以需要从惯性仪表,即陀螺仪

学位

基于动态光谱的人体血红蛋白检测

人体血红蛋白浓度作为衡量人体健康水平的重要依据,其无创检测技术一直是临床医学领域的研究热点,同时动态光谱法能够有效抑制由个体差异和测量环境带来的影响,是一种具有广阔前景的数据分析方法,于是本文应用动态光谱法设计了人体血红蛋白无创检测系统。本文首先结合STM32F103ZE开发平台设计了八波长脉搏波数据采集平台,该平台通过控制脉冲型自动功率控制（Automatic Power Contyol,APC

学位

基于SURF和半色调映射加密的彩色零水印算法研究

针对目前零水印算法对几何攻击鲁棒性差、相似图像错误认证、彩色水印信息量过多带来效率低下和安全性不足等问题,提出一种基于加速鲁棒特征（Speed up Robust Features,SURF）的几何校正和半色调映射加密的彩色零水印算法。先从图像中提取少量SURF特征点,将特征点信息保存为密钥用于实现盲检测,再从图像中提取特征构建零水印。在版权验证过程中,从攻击图像提取特征点并和密钥匹配,而后筛选特

学位

基于注意力机制的道路场景目标检测算法研究

目标检测作为目前计算机视觉的热门研究课题,在生活中和学术界的应用都有了深入的研究,将基于深度学习的目标检测算法应用于实际道路场景中,是各大汽车公司对于自动驾驶等车端辅助系统研究的方向和热点。当前,道路场景物体密集复杂、信息众多、车辆和行人之间遮挡和重叠的现象严重,针对传统目标检测算法在复杂场景下存在诸多问题,无法满足检测精度要求,提出一种改进YOLO v3的道路场景目标检测算法。针对道路场景中信息

学位

基于改进Alpha混合调制的彩色图像盲水印算法

水印的嵌入位置和嵌入规则对水印算法性能具有重要的影响,传统Alpha混合调制数字水印算法利用图像子块随机嵌入水印信号存在嵌入容量低难以嵌入彩色图像、非盲提取、不可见性和鲁棒性较差的问题。针对上述问题,提出基于改进Alpha混合调制的彩色图像盲水印算法。首先,根据彩色水印图像特征结合重复码技术,对水印进行容错压缩加密编码,生成待嵌入信息序列和密钥;其次,将彩色载体图像进行提升小波变换,取低频分量分块

学位

边界先验与频域信息融合的显著性目标检测

随着互联网多媒体技术的迅速发展,大众获取和分享图片的需求也急剧增加。显著性目标检测技术可以从繁杂的图像数据中快速准确地定位重要信息,减少计算量。在复杂场景下的显著性目标检测中,针对生成的显著效果图存在复杂背景分离效果不理想、显著区域边缘轮廓不完整的问题,提出一种边界先验与频域信息融合的显著性目标检测方法。首先,对输入的原图像通过简单线性迭代聚类的超像素分割算法完成预处理操作,获得预处理图;其次,通

学位

融合聚类优化和矩阵填充的协同过滤推荐算法研究

对于当下的协同过滤推荐算法而言,存有评分片面、主观性强、评分矩阵稀疏等问题影响了推荐的准确度,使得推荐结果较差。针对上述问题,提出一种融合聚类优化和矩阵填充的协同过滤推荐算法。算法首先采用基于电影项目类型信息的“领域最近邻”方法来对用户项目评分矩阵予以估值填充,进而完成矩阵由稀疏到稠密的转变;接着利用模糊C-均值聚类算法筛选出相关邻居集合,增强用户聚类效果,并将麻雀搜索算法引入模糊C-均值聚类中,

学位

融合模糊聚类和改进相似度的协同过滤推荐算法研究

目前,各推荐系统普遍面临数据稀疏的问题,仅将用户与项目的联系简单地停留在信息表层,并未深度挖掘用户对不同项目的兴趣程度,推荐准确率较低,影响推荐效果。针对上述问题,本文提出了一种融合模糊聚类和改进相似度的协同过滤推荐算法,在推荐技术中应用聚类思想的同时构建一种新的相似度计算方法,以解决推荐技术中存在的问题。首先,从项目的角度出发,在数据处理的过程中,基于项目的协同过滤算法充分挖掘项目间的数据关系,

学位

自适应时间正则化特征融合的目标跟踪

针对互补学习跟踪算法在出现遮挡或背景复杂等干扰时容易出现跟踪漂移的问题,提出了自适应时间正则化特征融合的跟踪算法。首先,在相关滤波器模型目标函数中加入时间正则项,并利用响应值变化情况控制时间惩罚强度实现自适应更新时间正则化参数,更加灵活的缓解相关滤波器模型退化,实现更优化的抑制算法学习异常。其次,使用巴氏系数实时计算每一帧前景颜色直方图与背景颜色直方图的相似度并利用对数损失函数求得最终融合因子,实

学位

基于自适应聚焦损失的图像目标检测

与本文相关的学术论文