细粒度图像分类的互补注意力方法

来源 :中国图象图形学报 | 被引量 : 0次 | 上传用户:jeaceinter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的 由于分类对象具有细微类间差异和较大类内变化的特点,细粒度分类一直是一个具有挑战性的任务.绝大多数方法利用注意力机制学习目标中显著的局部特征.然而,传统的注意力机制往往只关注了目标最显著的局部特征,同时抑制其他区域的次级显著信息,但是这些抑制的信息中通常也含有目标的有效特征.为了充分提取目标中的有效显著特征,本文提出了一种简单而有效的互补注意力机制.方法 基于SE(squeeze-and-exci-tation)注意力机制,提出了一种新的注意力机制,称为互补注意力机制(complemented SE,CSE).既从原始特征中提取主要的显著局部特征,也从抑制的剩余通道信息中提取次级显著特征,这些特征之间具有互补性,通过融合这些特征可以得到更加高效的特征表示.结果 在CUB-Birds(Caltech-UCSD Birds-200-2011)、Stanford Dogs、Stanford Cars和FGVC-Aircraft(fine-grained visual classification of aircraft)4个细粒度数据集上对所提方法进行验证,以Res-Net50为主干网络,在测试集上的分类精度分别达到了87.9%、89.1%、93.9%和92.4%.实验结果表明,所提方法在CUB-Birds和Stanford Dogs两个数据集上超越了当前表现最好的方法,在Stanford Cars和FGVC-Aircraft数据集的表现也接近当前主流方法.结论 本文方法着重提升注意力机制提取特征的能力,得到高效的目标特征表示,可用于细粒度图像分类和特征提取相关的计算机视觉任务.
其他文献
目的 深度卷积网络在图像超分辨率重建领域具有优异性能,越来越多的方法趋向于更深、更宽的网络设计.然而,复杂的网络结构对计算资源的要求也越来越高.随着智能边缘设备(如智能手机)的流行,高效能的超分重建算法有着巨大的实际应用场景.因此,本文提出一种极轻量的高效超分网络,通过循环特征选择单元和参数共享机制,不仅大幅降低了参数量和浮点运算次数(floating point operations,FLOPs),而且具有优异的重建性能.方法 本文网络由浅层特征提取、深层特征提取和上采样重建3部分构成.浅层特征提取模块
目的 在点云场景中,语义分割对场景理解来说是至关重要的视觉任务.由于图像是结构化的,而点云是非结构化的,点云上的卷积通常比图像上的卷积更加困难,会消耗更多的计算和内存资源.在这种情况下,大尺度场景的分割往往需要分块进行,导致效率不足并且无法捕捉足够的场景信息.为了解决这个问题,本文设计了一种计算高效且内存高效的网络结构,可以用于端到端的大尺度场景语义分割.方法 结合空间深度卷积和残差结构设计空间深度残差(spatial depthwise residual,SDR)块,其具有高效的计算效率和内存效率,并且
目的 针对图像融合中存在的目标信息减弱、背景细节不清晰、边缘模糊和融合效率低等不足,为了充分利用源图像的有用特征,将双尺度分解与基于视觉显著性的融合权重的思想融合在一起,提出了一种基于显著性分析和空间一致性的双尺度图像融合方法.方法 利用均值滤波器对源图像进行双尺度分解,先后得到源图像的基层图像信息和细节层图像信息;对基层图像基于加权平均规则融合,对细节层图像先基于显著性分析得到初始权重图,再利用引导滤波优化得到的最终权重图指导加权;通过双尺度重建得到融合图像.结果 根据传统方法与深度学习的不同特点,在T
视觉环境感知在自动驾驶汽车发展中起着关键作用,在智能后视镜、倒车雷达、360°全景、行车记录仪、碰撞预警、红绿灯识别、车道偏移、并线辅助和自动泊车等领域也有着广泛运用.传统的环境信息获取方式是窄角针孔摄像头,视野有限有盲区,解决这个问题的方法是环境信息感知使用鱼眼镜头,广角视图能够提供整个180°的半球视图,理论上仅需两个摄像头即可覆盖360°,为视觉感知提供更多信息.处理环视图像目前主要有两种途径:一是对图像先纠正,去失真,缺点是图像去失真会损害图像质量,并导致信息丢失;二是直接对形变的鱼眼图像进行建模
目的 通道注意力机制在图像超分辨率中已经得到了广泛应用,但是当前多数算法只能在通道层面选择感兴趣的特征图而忽略了空间层面的信息,使得特征图中局部空间层面上的信息不能合理利用.针对此问题,提出了区域级通道注意力下的图像超分辨率算法.方法 设计了非局部残差密集网络作为网络的主体结构,包括非局部模块和残差密集注意力模块.非局部模块提取非局部相似信息并传到后续网络中,残差密集注意力模块在残差密集块结构的基础上添加了区域级通道注意力机制,可以给不同空间区域上的通道分配不同的注意力,使空间上的信息也能得到充分利用.同
10月27日,湖北省无线电监测中心随州监测站联合市公安局东城派出所,在市东城办事处一小区楼顶查获一套无人值守的“黑广播”.rn当天,湖北省无线电监测中心对移动监测车进行了改造升级,之后进行测试时发现频率为93.2MHz的调频广播信号正在播放非法药品广告,经比对频率台站数据库,确认其为“黑广播”.之后,监测站迅速启动非法信号查处应急预案,组织技术人员利用刚改装升级的移动监测车和便携式监测设备,对该“黑广播”进行测向定位,最终将其锁定在市东城办事处某住宅小区3号楼楼顶的水箱处.
期刊
机器的情感是通过融入具有情感能力的智能体实现的,虽然目前在人机交互领域已经有大量研究成果,但有关智能体情感计算方面的研究尚处起步阶段,深入开展这项研究对推动人机交互领域的发展具有重要的科学和应用价值.本文通过检索Scopus数据库选择有代表性的文献,重点关注情感在智能体和用户之间的双向流动,分别从智能体对用户的情绪感知和对用户情绪调节的角度开展分析总结.首先梳理了用户情绪的识别方法,即通过用户的表情、语音、姿态、生理信号和文本信息等多通道信息分析用户的情绪状态,归纳了情绪识别中的一些机器学习方法.其次从用
本文分析讨论了三种监测测向固定站的信号传输方案,通过多个维度的分析比较,指出基于光纤数字化传输的方案,在高频段信号监测和测向中具有提升监测灵敏度、便于测向控制、节省成本等明显优势,可作为后续固定式监测测向站的设计参考.
目的 多曝光图像融合(multi-exposure fusion,MEF)是利用一组不同曝光度的低动态范围(low dynamic range,LDR)图像进行合成,得到类似高动态范围(high dynamic range,HDR)图像视觉效果图像的过程.传统多曝光图像融合在一定程度上存在图像细节信息受损、边界不清晰以及部分色彩失真等问题.为了充分综合待融合图像的有效信息,提出了一种基于图像分解和色彩先验的双尺度多曝光图像融合方法.方法 使用快速导向滤波进行图像分解,分离出细节层对其进行增强处理,保留更多
1前言rn按照《国家无线电管理规划(2016-2020年)》的要求,需要建设省级无线电管理一体化平台,完善频率、台站、监测、设备以及地理环境等各类基础数据库,实现数据的规范化和标准化,确保数据完整性、实时性和准确性,逐步实现数据共享.本文重点研究探讨省级无线电管理一体化平台的设计与实现.
期刊