空间注意力相关论文
为了解决植保无人机作业时,传统田间障碍物识别方法依赖人工提取特征,计算耗时较长,难以实现在非结构化田间环境下实时作业识别的问题......
手语识别的研究对于改善聋哑人生活质量具有重要意义,同时促进着人机交互领域的发展。针对手语视频中存在大量无关帧,手语识别过程中......
近年来,小样本学习逐渐被学术界广泛研究,其旨在使模型在给定样本较少的情况下完成一系列任务。目前基于度量学习的元学习算法被广......
语义分割是智能机器人由感知智能迈向认知智能的重要基础,当前针对点云数据的语义分割方法存在实时性差、精度低等现象。本文系统分......
针对以往的图像分类方法利用手工提取的特征(或通过神经网络提取的特征)、空间信息关注不足等问题,文章提出一种基于空间注意力的图像......
目的 经典的人眼注视点预测模型通常采用跳跃连接的方式融合高、低层次特征,容易导致不同层级之间特征的重要性难以权衡,且没有考虑......
术前预测透明细胞肾细胞癌(clear cell Renal Cell Carcinoma,ccRCC)的分级可有效评估患者的预后并指导临床治疗,但实现精准预测是目前......
交通预测作为实现智能交通系统的重要一环,受到研究人员的广泛关注。交通状态的变化趋势不仅受时间维度的影响,还受道路空间结构的......
高分辨率遥感影像建筑物自动提取在防灾减灾、灾害估损、城市规划和地形图制作等方面具有重要意义。但是,目前常用的传统卷积神经网......
图像模糊是一种常见的图像退化类型,它会导致图像细节的丢失,如物体运动造成的运动模糊,对焦不准导致的失焦模糊。图像去模糊就是......
随着计算机视觉技术的高速发展,视觉目标跟踪也成为了重要的研究领域,被广泛用于视频监控、人机交互等分析任务中。视觉目标跟踪在......
针对传统图像处理算法的芯片缺陷检测方法难以实现缺陷的精确提取且泛化性较差的问题,提出了结合空间注意力机制(SAM)、空间金字塔池......
针对实际交通场景下的车辆图像分割方法存在模糊、效果差的问题,本文以UNet神经网络模型为基础,提出了一种融合多尺度模块和空间注意......
随着科学技术的发展,人们对高分辨率图像的需求日益增长。而受制于当前技术以及预算的限制,这种需求并不能得到很好的满足。同时,......
视频中的行人跟踪与计数是计算机视觉方向的重要研究领域。近期,基于相关滤波(CF)方法在视觉目标跟踪任务上展示出良好的性能。然而,......
随着自动驾驶技术研究的不断深入,对交通场景的深入理解变得愈发重要,交通场景图像语义分割在自动驾驶领域中起着举足轻重的作用,......
行人属性识别是视频监控领域中的重要任务,因其在视频监控应用中的巨大潜力在近些年来受到了广泛关注,它可以应用于很多下游任务中......
人脸属性编辑是指改变人脸图像的某些属性,如妆容、发型、表情等,而保持其他属性不变的手段,目标是提高属性编辑的准确性和生成图......
图像语义分割任务中,难点之一便是如何在卷积神经网络的计算复杂性和分割精度之间达到高效平衡。为了追求高分割精度,通常采用深层......
多目标跟踪技术涉及到机器学习、统计分析、模式识别等多种研究学科,具有重大的研究价值。多目标跟踪的核心理论是通过对视频序列......
细粒度图像之间具有高度相似的外观,其差异往往体现在局部区域,提取具有判别性的局部特征成为影响细粒度分类性能的关键。引入注意......
当前基于深度学习的遥感图像目标检测方法因模型复杂、计算量大,难以部署在计算资源受限的卫星上进行实时在轨检测。针对该问题,提......
动态场景下的图像去模糊技术是一个具有挑战性的计算机视觉问题。模糊图像不仅影响主观感受,还会影响后续的智能化分析的性能。提......
为解决服装风格的细粒度识别问题,提出一种改进的Bilinear-CNN(convolutional neural network)模型。在VGG16特征提取网络的输出特......
基于Siamese网络的跟踪算法在跟踪精度和速度方面展现出巨大的潜力,然而要使离线训练的模型适应在线跟踪仍然面临着挑战。为了提升......
随着安防行业的发展,视频监控探头被广泛用于日常生活,日益增长的视频数据和日新月异的应用场景给计算机视觉领域提出了新的算法需......
随着国民经济的快速发展,汽车保有量持续增加,社会所面临的交通监管压力日益增大,一系列城市交通问题随之而来,对国家和个人造成了......
针对人脸分割的精度问题,提出了融合网络深层特征和浅层特征的新结构,三次精调人脸检测框,提高人脸分割的精确度。新结构结合通道......
随着无人机技术在军事、民用等领域的广泛运用,高精度、低功耗智能无人机跟踪系统的需求也日益增多。针对无人机跟踪任务中目标尺......
目的多层特征对于显著性检测具有重要作用,多层特征的提取和融合是显著性检测研究的重要方向之一。针对现有的多层特征提取中忽略......
图像奇异值分解产生的归一化系数可以保留原始图像的大部分纹理信息并对光照条件不敏感,本文中采用归一化后的奇异值矩阵即奇异值......
为及时发现铁路桥梁高强螺栓偶发的延迟断裂并补充新螺栓,降低铁路桥梁连接失效风险,开展基于卷积神经网络的桥梁高强螺栓缺失图像......
为更好地将图像去雨算法应用在户外监控、手机移动终端上,提出一种基于局部空间注意力机制的轻量级卷积神经网络。将图像去雨看作......
单幅图像超分辨率(Single Image Super Resolution,SISR)在计算机视觉领域占有重要地位,该技术旨在从低分辨率图像中重建出高分辨......
声目标识别是声音信号处理领域的热点研究课题,致力于通过分析声音信号中所包含的复杂特征,识别其中包含的语义信息,最终实现声目......
针对图像分类任务中现有神经网络模型对分类对象特征表征能力不足,导致识别精度不高的问题,提出一种基于轻量级分组注意力模块(LGA......
眼底视网膜血管的分割提取对于糖尿病、视网膜病、青光眼等眼科疾病的诊断具有重要的意义。针对视网膜血管图像中的血管难以提取、......
图像描述是连接计算机视觉与自然语言处理两大人工智能领域内的一项重要任务.近几年来,基于注意力机制的编码器-解码器架构在图像......
空间注意力机制和高层语义注意力机制都能够提升图像描述的效果,但是通过直接划分卷积神经网络提取图像空间注意力的方式不能准确......
生猪脸部包含丰富的生物特征信息,对其脸部姿态的检测可为生猪的个体识别和行为分析提供依据,而在生猪群养场景下,猪舍光照、猪只......
实时语义图像分割算法出于模型推理速度考虑,通常会采取减少网络深度、宽度,缩小输入图片分辨率等方式来限制模型计算量和参数量。......