基于注意力机制和Soft-NMS的改进Faster R-CNN目标检测算法

来源 :激光与光电子学进展 | 被引量 : 0次 | 上传用户:rain12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目标检测网络FasterR-CNN存在的漏检、误检和检测精度问题,提出一种融合注意力机制和Soft-NMS的Faster R-CNN目标检测算法。首先,为了增强Faster R-CNN目标检测网络对特征图全局重要特性的提取并弱化无关特性,在网络中引入了注意力机制;其次,针对注意力机制CBAM采用两个全连接层构成瓶颈结构造成局部信息损失的问题,构建了一种可以和卷积神经网络进行端到端训练的非降维通道注意力和空间注意力串联模块;然后,通过在区域建议网络后引入Soft-NMS替换传统的非极大抑制(NMS
其他文献
针对通用目标检测算法在检测小目标时检测精度低的问题,提出一种基于多尺度感受野融合的小目标检测算法S-RetinaNet。该算法采用残差神经网络(Residual Neural Network, ResNet)提取出图像的特征,利用递归特征金字塔网络(Recursive Feature Pyramid Network, RFPN)对特征进行融合,通过多尺度感受野融合模块(Multiscale Rec
期刊
复杂场景中的人脸检测由于受到图像质量、人脸尺度和光线等因素影响,精准地定位小人脸、避免漏检、误检是一件极具挑战性的任务。论文提出了一种基于YOLOv3,融合图像超分辨率重建技术的两级人脸检测模型SR-YOLOv3。针对场景中小人脸目标的漏检问题,利用K-means++算法对先验框进行聚类分析,设置更小尺寸的先验框来捕获小人脸信息;针对模糊小尺度人脸的误检问题,采用Darknet53作为主干网络,融
期刊
针对外形相似的水稻种子间分类难、识别正确率低等问题,提出一种卷积神经网络与支持向量机相结合的方法(CNN_SVM)对8类水稻种子进行分类识别。首先对图像进行切割、旋转等预处理后建立水稻种子图像数据库,其次通过提取图像的方向梯度直方图(HOG)、LBP纹理、SIFT描述子和CNN特征,分别建立SVM、KNN和Softmax分类模型对水稻种子图像进行分类识别比较。最后采用随机加入噪声点方法模拟噪声干扰
期刊
为克服不同相机视角之间的域偏移问题,提出一种基于域通用和域分离字典对学习的跨视角行人重识别算法。具体地,基于来自同一相机视角下的行人共享相同的域,并且同一视角中每个行人图像所携带的域信息在短时间内具有一致性,将同一视角下的行人图像分解为特定视角的域信息分量和域分离的行人外观特征分量,提出一个判别字典学习模型以创建用于描述域信息分量的域通用字典和描述行人外观分量的域分离字典。首先,由于来自同一相机视
期刊
利用卷积神经网络对行人图像提取一个简单的全局特征,在复杂的行人重识别任务中无法获得令人满意的结果。局部特征学习的方式有助于获取更丰富的人体特征,但往往需要图像中的人体具有良好的空间对齐,而且,将人体各部分特征输入到独立的分支学习局部信息,忽略了人体各部分特征间的相关性,限制模型的性能提升。在此背景下,(1)提出了一种新的多尺度特征学习算法,结合全局与局部特征学习得到更好的行人表示,提升复杂场景下模
期刊
在无监督领域自适应中分类器对目标域的样本进行类别预测时容易产生混淆预测,虽然已有研究提出了相关算法提取到样本的类间相关性,降低了分类器在目标域上的类混淆预测。但该方法仍然未能解决源域和目标域因共享特征稀疏导致的迁移学习能力不足的问题,针对这个问题,通过使用生成对抗网络对源域进行了风格迁移,扩展源域各类样本的特征空间可供目标域匹配的共享特征,解决因共享特征稀疏导致分类器正迁移力不足的问题,从而进一步
期刊
多目标跟踪技术在视频分析、信号处理等领域有着广泛的应用。在现代多目标跟踪系统通常遵循的“按检测跟踪”模式中,目标检测器的性能决定了多目标跟踪任务的跟踪精度和速度。为提高多目标跟踪系统跟踪性能,提出了面向多目标跟踪系统的专用循环目标检测器,它利用视频帧序列间高度相似性的特点,依据先前帧的目标位置信息和当前帧相对于先前帧的变化得分图来选取候选框,解决了传统二阶段目标检测器中使用候选框推荐网络带来的参数
期刊
为了提高最大二维熵分割的性能,提出了基于改进麻雀算法(ITSSA)的最大二维熵分割方法,减小运算量并且缩短计算时间。首先,融合反向学习策略和自适应t分布变异,引入精英粒子,以扩大算法搜索范围,增加算法后期局部搜索能力。其次,使用萤火虫机制,对最优解进行扰动变异,进一步增加种群多样性。最后,使用提出的改进麻雀算法寻找图像最大二维熵,得到最优阈值分割图像。经过理论分析和实验验证,在4幅图像的平均运行时
期刊
日干配错断裂位于青藏高原中部,是“V”型共轭走滑构造中班公湖—怒江缝合带以北的一条NEE–SWW走向左行走滑断裂,在调节青藏高原南北向挤压和东西向伸展过程中起着重要的作用。在2008年1月9日及2020年7月23日,先后在该断裂南西端和北东支分别发生6级以上强震。因此,查明该断裂的晚第四纪活动性及其与区域强震活动的关系,有助于更好地认识该地区的活动构造变形样式及其控震特征。本文通过高精度卫星影像解
期刊
根据现场遗留鞋印推断出作案人所穿鞋型,再到周围监控视频中搜索嫌疑鞋型已成为公安机关侦破案件的重要技战法。该技战法完全依赖人工筛查,受主观影响大,易造成漏检等问题。针对这一问题,本文提出一种基于注意力机制的鞋型识别算法,实现对监控视频中的行人所穿鞋型的自动识别。首先贴近公安刑侦实战建立样本容量为300的多背景监控鞋型数据集,进而提出一种注意力机制模型,用于增强ResNet50网络对鞋子重要特征的提取
期刊