基于全尺度和注意力融合学习的车辆再识别方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:hesion001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车辆再识别(Re-identification)是计算机视觉领域的研究热点之一,其关键在于车辆辨别性特征的提取。为了更好地提取此类特征,本文提出了一种基于全尺度和注意力融合学习的特征提取方法,该方法通过多个感受野获取不同尺度的特征,并将提取到的不同尺度特征融合;同时为了在特征提取过程中重点关注辨别性特征,特引入注意力机制,增强特征的表达能力。经实验证明,该方法在VeRi-776主流数据集上的Rank-1和mAP均优于其他主流方法。
其他文献
为了解决设计面向点云数据的神经网络需要大量人工介入的问题,提出了基于注意力机制和点卷积的神经网络架构搜索方法。首先,针对不同尺度点云的信息融合问题,提出了一种基于注意力机制的多尺度融合模块。其次,针对点云的处理效率问题,设计了基于点卷积的特征提取模块作为候选操作,并与多尺度融合模块组成搜索单元。将多个搜索单元叠加成的神经网络作为搜索空间,并采用基于可微分神经网络架构搜索算法搜索出最优神经网络。在公
期刊
为了有效地获取到更有区别性的跨模态表示,提出了一种基于多负例对比机制的跨模态表示学习方法——监督对比的跨模态表示学习(Supervised Contrastive Cross-Modal Representation Learning ,SCCMRL),并将其应用于视觉模态和听觉模态上。SCCMRL分别通过视觉编码器和音频编码器提取得到视听觉特征,利用监督对比损失让样本数据与其多个负例进行对比,使
期刊
小样本学习是视觉识别中的一个受关注的领域,旨在通过少量的数据来学习新的视觉概念。为了解决小样本问题,一些元学习方法提出从大量辅助任务中学习可迁移的知识并将其应用于目标任务上。为了更好地对知识进行迁移,提出了一种基于记忆的迁移学习方法。首先,提出一种权重分解策略,将部分权重分解为冻结权重与可学习权重,在迁移学习中通过固定冻结权重,仅更新可学习权重的方式来减少模型需要学习的参数。其次,通过一个额外的记
期刊
人体姿态估计是计算机视觉中的基础任务,其可应用于动作识别、游戏、动画制作等。受非局部均值方法的启发,本文设计了非局部高分辨率网络(Non-Local High-Resolution,NLHR),在原始图像1/32分辨率的网络阶段融合非局部网络模块的,使网络有了获取全局特征的能力,从而提高人体姿态估计的准确率。NLHR网络在MPII数据集上训练,在MPII验证集上测试,PCKh@0.5评价标准下的平
期刊
为了研究传统目标检测算法在进行道路小目标检测时效果不佳及漏检率较高等问题,本文提出了一种基于改进YOLOv3的小目标检测方法。首先通过设计新的特征融合结构降低小目标漏检率,并且使用DIOU损失提高定位精确度。同时对YOLOv3算法中的聚类算法进行改进,采用K-means++算法改进聚类先验框中心点的提取,选取更为合适的Anchor Box,用于提高检测的平均精度和速度。在自制混合数据集上对行人及车
期刊
为了解决预训练集和跟踪视频的域不一致性导致跟踪模型判别能力不足的问题,提出了一种基于原型注意力的多域网络目标跟踪方法。以实时多域网络目标跟踪方法为研究对象,在训练过程中引入原型网络提取注意力特征。基于支撑集正负样本得到目标与背景的域特定原型注意力,将其与待跟踪视频的特征图进行逐通道自适应融合,使得模型在大型数据集上得到判别力更强的目标表示,从而增强跟踪算法的性能。在OTB100和TrackingN
期刊
语音驱动人脸生成旨在挖掘语音片段和人脸之间的静动态关联性,进而由给定的语音片段生成对应的人脸图像。然而已有的研究方法大多只考虑其中的一种关联性,且对静态人脸生成的研究严格依赖于时序对齐的音视频数据,在一定程度上限制了静态模型的使用范围。因此,提出了一种基于条件生成对抗网络的语音驱动静动态人脸生成模型(SDVF-GAN)。该模型首先基于自注意力机制构建语音编码器网络以获得更为准确的听觉特征表达,并将
期刊
在遮挡场景下的行人检测一直是计算机视觉中的一个棘手问题,由于被遮挡的行人尺度差异大,可见率低,通常会给检测带来极大的挑战。针对这一问题,本文提出了一种针对行人遮挡检测的模型结构,对基于anchor-free的行人检测方法进行改进。首先设计了一种提取多尺度上下文信息的结构,通过级联多个不同扩张率的卷积层,使用密集连接实现多尺度特征共享,提取各个区域的上下文信息来解决遮挡问题。此外,为了提高特征的可分
期刊
近年来,深度学习在图像处理中表现显著,因此研究者开始将深度学习用于磁共振成像的重构。现有的深度学习模型需要依赖大量数据进行训练,而医学图像很难获得大量数据,因此,为有效的提高MR成像重构的质量,我们提出一个在小数据集上表现良好的深度学习MRI重构方法。本文对U-Net模型进行改进,结合GoogleLeNet和ResNet的优势,提出了UGR-Net模型,并与数据一致性层结合得到级联的UGR-Net
期刊
在CT图像分割的过程中,通常都会先使用窗口技术对图像数据做预处理。然而,由于脏器组织与病变组织密度的不均匀性,使得这种预处理方式并不能完全将无效信息除去而重点关注脏器和病变部位。受注意力机制的启发,本文提出了一种新的CT图像预处理方式。首先,根据专家经验制作标签,计算出组织的空间概率分布,利用概率分布制作出CT蒙版。其次,将蒙版覆盖到原图上后即可除去大量低概率区域的图像信息,降低网络学习难度。对于
期刊