【摘 要】
:
针对现实场景中行人图像被遮挡以及行人姿态或视角变化造成的未对齐问题,该文提出一种基于多样化局部注意力网络(DLAN)的行人重识别(Re-ID)方法.首先,在骨干网络后分别设计了全局网络和多分支局部注意力网络,一方面学习全局的人体空间结构特征,另一方面自适应地获取人体不同部位的显著性局部特征;然后,构造了一致性激活惩罚函数引导各局部分支学习不同身体区域的互补特征,从而获取行人的多样化特征表示;最后,将全局特征与局部特征集成到分类识别网络中,通过联合学习形成更全面的行人描述.在Market1501,DukeM
【机 构】
:
西安建筑科技大学信息与控制工程学院 西安 710055;人工智能与数字经济广东省实验室(广州) 广州 510320;西安建筑科技大学信息与控制工程学院 西安 710055
论文部分内容阅读
针对现实场景中行人图像被遮挡以及行人姿态或视角变化造成的未对齐问题,该文提出一种基于多样化局部注意力网络(DLAN)的行人重识别(Re-ID)方法.首先,在骨干网络后分别设计了全局网络和多分支局部注意力网络,一方面学习全局的人体空间结构特征,另一方面自适应地获取人体不同部位的显著性局部特征;然后,构造了一致性激活惩罚函数引导各局部分支学习不同身体区域的互补特征,从而获取行人的多样化特征表示;最后,将全局特征与局部特征集成到分类识别网络中,通过联合学习形成更全面的行人描述.在Market1501,DukeMTMC-reID和CUHK03行人重识别数据集上,DLAN模型的mAP值分别达到了88.4%,79.5%和74.3%,Rank-1值分别达到了95.1%,88.7%和76.3%,明显优于大多数现有方法,实验结果充分验证了所提方法的鲁棒性和判别能力.
其他文献
舌色是中医(TCM)望诊最关注的诊察特征之一,自动准确的舌色分类是舌诊客观化研究的重要内容.由于不同类别舌色之间的视觉界限存在模糊性以及医生标注者的主观性等,标注的舌象数据中常含有噪声,影响舌色分类模型的训练.为此,该文提出一种有噪声标注情况下的中医舌色分类方法:首先,提出一种两阶段的数据清洗方法,对含有噪声的标注样本进行识别,并进行清洗;其次,设计一种基于通道注意力机制的轻型卷积神经网络,通过增强特征的表达能力,实现舌色的准确分类;最后,提出一种带有噪声样本过滤机制的知识蒸馏策略,该策略中加入了由教师网
针对Linux系统下配置Samba共享服务只能通过用户手动编辑配置文件,且配置项众多、步骤繁琐、上手困难等问题,分析了Samba配置文件的结构和配置项的具体作用,结合重载Samba配置和使配置生效的相关系统指令,通过Python的OS库执行系统命令,设计了基于Python的Samba配置解析算法,解析系统中已存在的Samba配置和生成可用的Samba配置文件,使用Pyside2设计了基于QT的图形化界面展示解析结果、接收用户输入的参数及响应用户操作.实际应用结果表明,该工具实现了Samba服务的图形化配置
医疗机器翻译对于跨境医疗、医疗文献翻译等应用具有重要价值.汉英神经机器翻译依靠深度学习强大的建模能力和大规模双语平行数据取得了长足的进步.神经机器翻译通常依赖于大规模的平行句对训练翻译模型.目前,汉英翻译数据主要以新闻、政策等领域数据为主,缺少医疗领域的数据,导致医疗领域的汉英机器翻译效果不佳.针对医疗垂直领域机器翻译训练数据不足的问题,该文提出利用复述生成技术对汉英医疗机器翻译数据进行增广,扩大汉英机器翻译的规模.通过多种主流的神经机器翻译模型的实验结果表明,通过复述生成对数据进行增广可以有效地提升机器
由于缺少统一人体活动模型和相关规范,造成已有可穿戴人体活动识别技术采用的传感器类别、数量及部署位置不尽相同,并影响其推广应用.该文在分析人体活动骨架特征基础上结合人体活动力学特征,建立基于笛卡尔坐标的人体活动模型,并规范了模型中活动传感器部署位置及活动数据的归一化方法;其次,引入滑动窗口技术建立将人体活动数据转换为RGB位图的映射方法,并设计了人体活动识别卷积神经网络(HAR-CNN);最后,依据公开人体活动数据集Opportunity创建HAR-CNN实例并进行了实验测试.实验结果表明,HAR-CNN对
针对传统安全教育存在教育方式单一、时间成本高、参与度低、教育效果不佳等问题,提出基于iBeacon的安全教育智慧语音系统.通过精准定位的语音自动播报,将安全教育培训从聚集性培训转变为自主的无接触式学习,实现建筑工地的智能移动安全语音教育.其创新研发及应用,实现“零接触”出入登记、“无聚集”安全培训,助力了基层疫情防控常态化管理.应用结果表明,该系统有效降低了安全培训成本,提高了培训频次,丰富了培训手段,并能通过数据积累与分析,提高管理决策的效率和质量,实现智能数据驱动安全管理.
介绍了射频识别(RFID)技术的起源与发展历程,根据RFID技术的原理,指出RFID系统相对于传统识别技术的优势并阐明了标签天线在RFID系统中的关键作用.简述了目前RFID技术在市场上的典型应用,分析了天线设计的技术难点,并对国内外关于实现标签天线小型化、宽频带、高增益与阻抗匹配的设计方法和研究进展进行了总结.基于RFID天线的工作原理,说明了标签天线设计的基本原则,概述了标签天线设计的基本流程及性能测试方法.分析表明,在保证天线小型化的前提下,解决天线尺寸与性能间协调设计的技术难点,RFID系统将在物
为了让网络捕捉到更有效的内容来进行行人的判别,该文提出一种基于阶梯型特征空间分割与局部分支注意力网络(SLANet)机制的多分支网络来关注局部图像的显著信息.首先,在网络中引入阶梯型分支注意力模块,该模块以阶梯型对特征图进行水平分块,并且使用了分支注意力给每个分支分配不同的权重.其次,在网络中引入多尺度自适应注意力模块,该模块对局部特征进行处理,自适应调整感受野尺寸来适应不同尺度图像,同时融合了通道注意力和空间注意力筛选出图像重要特征.在网络的设计上,使用多粒度网络将全局特征和局部特征进行结合.最后,该方
为了提高图像超分辨率重建的效果,该文将注意力机制引入多级残差网络(Multi-level Residual Attention Network,MRAN)作为CycleGAN的重建网络,提出了基于循环生成对抗网络(CycleGAN)的超分辨率重建模型MRA-GAN.MRA-GAN模型中重建网络负责将低分辨率(LR)图像重建为高分辨率(HR)图像,退化网络负责将HR图像降采样为LR图像,LR判别器负责鉴别真实LR图像和通过退化网络降采样得到的LR图像,HR判别器负责鉴别真实HR图像和通过重建网络重建得到的H
基于位置社交网络的兴趣点(POI)推荐是人们发现有趣位置的重要途径,然而,现实中用户在不同区域的地点偏好侧重的差异,加之高维度的历史签到信息,使得精准而又个性化的POI推荐极富挑战性.对此,该文提出一种新型的基于类别转移加权张量分解模型的兴趣点分区推荐算法(WTD-PR).通过结合用户连续行为和时间特征,来充分利用用户的历史访问信息,从而得到类别转移权重因子;接着改进用户-时间-类别张量模型,在此张量中加入类别转移权重,预测用户的喜好类别;最后,根据用户的历史访问区域划分出本地和异地,并基于用户的当前位置
传统的单通道盲去卷积的方法存在仅能从混合信号中分离出2路源信号的局限,考虑到以上问题,该文提出一种基于优化的深度卷积生成对抗网络的单通道盲去卷积算法(SCBDC),能从1路混合信号中分离和解卷积出3路以上的独立源信号和混合矩阵.该文实验在汉字和遮挡图像数据集上进行,随机选择4路信号与混合矩阵进行卷积混合,实验结合峰值信噪比(PSNR)和信号相关性指标来评价分离的效果,结果显示,该算法能够有效地分离出多路源信号并去卷积.