基于注意力与多尺度分块的行人重识别算法研究与应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:tjyydtj1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别技术能自动研判视频监控以减少人工筛查成本,是计算机视觉领域的热点问题之一。在多摄像头场景下,同一行人在不同摄像头视角下的判别性特征难以提取、类间差异较少和类内差异较大、受摄像头周围环境造成的风格变化干扰等问题,造成行人重识别性能不足。针对以上问题,提出了基于注意力与多尺度分块的行人重识别算法(Person ReIdentification Algorithm Based on Attention and Multi Scale Partition,AMSP)。针对判别性特征难以提取,利用注意力机制对特征提取进行加强,并且基于空间与通道两个维度进行多级尺度分块,对人体部位进行局部多尺度、多维度的特征提取,解决了判别性特征难以提取的问题;针对类间差异较小和类内差异较大,采取联合学习方法,对所有特征利用分类损失外,再对全局特征联合使用三元组损失,抑制了类间差异较少和类内差异较大的问题。针对受摄像头规格、周围环境以及光线造成风格变化造成特征差异,引入了实例归一化去风格化模块,解决了由于风格变化造成干扰的问题。将提出的行人重识别算法在Market-1501、MSMT17以及Duke MTMC-Re ID公开数据集上进行了多项实验,在三个数据集上的m AP分别为90.5%、64.8%和82.2%,Rank_1分别为95.7%、85.4%和92.3%,达到了目前最好的行人重识别算法的识别性能,并有一定程度的提升,证明了其有效性。最后将提出的基于注意力与多尺度分块的行人重识别算法与行人检测技术YOLOv5相结合,在某电气公司的园区场景下进行了多摄像头行人重识别追踪任务的应用,结果证明其具有一定的有可行性与应用性。并且为了满足实际复杂场景的适用,利用雾化、模糊等20种数据腐蚀操作对Market-1501数据集进行随机腐蚀得到Market-1501随机腐蚀数据集,将提出的行人重识别算法与基于软随机擦除与随机自身替换的数据增强方法相结合,在Market-1501随机腐蚀数据集上的m AP为38.6%,Rank_1为65.5%,达到了领先水平。
其他文献
“双减”政策的实施,让很多教师在教学上有了新思考。但就目前情况来看,很多教师还未有完全理解双减政策的本质内容。“双减”减得不单是“书面作业”,更是学生的学习压力。基于此文章旨在探讨“双减政策”影响下的初中数学作业应该如何设计,并以《相交线与平行线》一单元的复习作业为例设计作业。
期刊
随着无线通信技术的高速发展,信号监测和处理这一课题也越来越具有研究价值,近如平时对非本土信息的监听探测,远如未来可能发生的战争中的无线军事情报收集,都是国家在国际局势中占据主动权的重要保证。无线通信的实现基于频段的划分,其中特高频频段是对讲机和手机通信的主要载波频段,对此频段的通信信号进行监测和分析意义重大。在对监测到的信号进行研究分析时,常常出现微弱信号淹没在噪声和干扰中的情况,严重影响了频谱分
学位
低压差线性稳压器(Low Dropout Regulator,LDO)是电源管理芯片中重要的一类。无片外电容型LDO凭借其易于集成、较好的线性调整率和负载调整率等优点,在模拟、射频和片上系统(System on Chip,So C)等电路系统中得到了广泛应用。然而,其静态功耗较大、大负载时电源抑制比(Power Supply Rejection Ratio,PSRR)较差等缺点,越来越难满足集成电
学位
随着汽车信息化和智能化水平的提升,传统车载总线CAN(Controller Area Network)协议有效信息载荷小、信息传输速率低和信道容量不足的问题逐渐暴露,因此对CAN FD(Controller Area Network with Flexible Data rate)协议进行研究有重要的工程意义。UVM(Universal Verification Methodology)验证方法学
学位
下霍井田位于华北聚煤盆地中部,含优质的二叠纪煤层。针对沁水煤田下霍井田煤系的沉积环境和聚煤规律开展研究,根据沉积特征,研究了煤系沉积环境及垂向演化;通过煤系及煤层顶底板沉积特征、煤层厚度变化、煤岩组分、煤中灰分硫分等分析了聚煤环境及煤层、煤质变化的影响因素。研究认为,太原组为本溪组填平补齐基础上的聚煤期泥炭沼泽—碳酸盐台地—瀉湖—三角洲—碎屑“废弃”相沉积组合,显示典型的海陆交互相约代尔旋回,属正
期刊
微环谐振器的高Q值、小尺寸、侵入性小、抗扰能力强等优点使其成为最具潜力的光学器件之一,在传感领域具有丰富的应用场景。微环谐振器的传感机理是基于折射率传感,可分为微环包层折射率传感和微环波导折射率传感两种传感模式。本文设计并制作了一款直通型聚苯乙烯波导微环谐振器,将其封装成稳定可测试的光学折射率传感器件,分别对微环谐振器的两种折射率传感模式进行研究、测试、优化以及应用。本文的具体工作如下:首先从微环
学位
在采用有监督的深度学习方法从眼底图像中分割出视网膜血管时,需要有多样性的眼底图像及对应的血管分割金标准训练。分割金标准往往需要手工标注,工作量大。针对大规模训练数据获取困难的问题,采用生成对抗网络生成图像不失为一种有效方法。根据眼底图像及其对应血管图像的生成需求,提出了一种先从噪声生成血管图像,再从血管图像生成眼底图像的两阶段方案。在第一阶段,为了从小规模的噪声生成大尺寸(即高分辨率)的血管图像,
学位
在卫星遥感领域,由于星地传输带宽有限,图像往往需要先经过压缩再下传,然后在地面进行解码恢复。因此,如何提高图像压缩比是一个非常值得研究的课题。本文采用一种保目标图像压缩的思路,在压缩前对图像进行目标检测,以此为依据对图像不同区域采用不同的压缩模式。含有目标的区域采用能够确保信息不丢失的无损压缩;背景区域采用压缩比高,但解码图像可能出现少量失真的微损压缩。本文以一种基于卷积神经网络的红外小目标检测算
学位
人机对话系统已被广泛应用于社会的各个方面。预训练语言模型在各项自然语言处理任务上不断取得突破,其在对话系统中的应用得到重点关注。检索式对话将复杂的对话问题转换为搜索问题,在实际的场景中预先设计大量的候选回复,系统根据用户输入检索出合适的回复,流程清晰且易于实现。由于预训练语言模型是在大规模通用数据上训练得到的,在对话领域适应性较弱,因此提出了一种利用对话匹配训练任务进行领域后训练的方法,通过使用对
学位
本文涉及一种卫星信息处理系统综合测试设备的设计与实现,模拟雷达/激光/光学相机等载荷接口,用于卫星信息处理系统的测试与验证。该综合测试设备具备指令数据和图像数据的收发功能,即接收信息处理系统发送的指令,生成测试数据发送至信息处理系统验证其功能;同时,该综合测试设备具备多路数据处理功能,包括对接收数据的存储、解析、应答及界面参数显示。该综合测试设备的核心功能是模拟多个子系统与信息处理系统进行多路数据
学位