深度学习下域自适应行人重识别方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:thonny007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会对智能监控系统和智能安保的需求逐年增加,行人重识别技术(Pedestrian re-identification,Re-ID)迎来了快速发展的契机。行人重识别也称行人再识别,是利用计算机视觉技术在无交叉的视图中搜寻出特定行人的智能化技术。有监督行人重识别由于需要手动绘制边界框和身份信息标定,且即使行人重识别模型在源域上取得了良好的性能,一旦将目标域中不同成像风格的相关图像引入测试,其识别准确率就会显著下降。此外,特征提取网络捕获的特征鲁棒性不强也是影响识别精度的一大原因。以上缺陷无法满足现实世界对智能监控系统的需要,因此本文将研究重点放在域自适应行人重识别上。为了解决行人重识别技术在实际应用中的缺陷,本文做了以下工作:1.针对训练图像与目标域图像风格不一致问题,提出一种保留行人自相似性和域差异性的域间图像风格转换模型。循环生成对抗网络与孪生网络联合完成图像风格一对多的学习,其中循环生成网络被用于转换源域的相关知识到目标域,孪生网络用作保留行人身份。在损失函数设计方面,最大均值差异函数用作确保变换后的源域中的特征分布与目标域中的原始特征分布相似,圆形损失函数用于通过增加正负对之间的差异来优化所提出模型的学习率,正对对应于包含同一个人的图像,负对由转换后的图像和目标域中的任何图像组成。该方法可以在图像风格从源域到目标域的转换过程中有效地保留原始人的身份信息,以提高行人重识别模型的对于不同域图像风格的自适应能力。2.针对行人特征鲁棒性不强问题,在特征提取网络中引入双重注意机制,分别在图像位置和通道维度层面上捕获特征的依赖关系。注意力机制使特征提取网络将注意力更多的放在行人前景特征上,而减少背景对特征鲁棒性的影响。具体来说,是在扩张的全卷积网络的顶部附加了两个平行的注意模块。一个是位置注意模块,另一个是通道注意模块。通道注意力模块选择性的强调包含关键信息的通道并捕获通道间的依赖关系,提升行人关键信息所在通道的重要性;位置注意力模块则在生成的空间注意矩阵上对所有特征进行加权累计更新,即使空间距离较远,相似的特征也将实现彼此关联。最后,对两个注意力模块的结果进行融合,优化特征表达。同时本文设计了一个新颖的无监督域自适应行人重识别框架。该框架由两个分支组成,一个分支利用含有标注信息的源域图像进行有监督下模型特征嵌入能力训练,另一个分支利用域内摄像头转换后的无标签目标域图像进行域内不变性训练。在相关主流数据集上的实验结果表明,所提出的保留行人自相似性和域差异性的图像风格转换方法与其他风格转换相比可以获得最优的结果,如在Market-1501为训练集,Duke MTMC-re ID为测试集时,其Rank-1精度为80.6%,m AP精度为66.7%。而提出的融入注意力机制的无监督域自适应行人重识别框架可以达到更高的精度,其Rank-1和m AP精度分别达到了82.1%和67.1%。
其他文献
随着移动机器人的快速发展,同步定位与建图(Simultaneous Localization and Mapping,SLAM)也有了长足的进步。视觉SLAM利用的传感器安装方式多元化且价格低廉,得到了学者们广泛关注进而提出大量视觉SLAM算法。回环检测是视觉SLAM中一个基础而关键的部分,它对消除SLAM系统中的累计误差具有十分关键的作用。未考虑回环检测算法的SLAM系统相当于一个里程计,仅依靠
学位
<正>户外自主游戏课程改革至今,上海大学附属实验幼儿园在放手游戏的过程中充分发现了儿童的多样化表征。受安吉游戏影响,也为更好地了解儿童,我园开始鼓励儿童灵活运用多种方式,在天气观察、自然角观察、游戏后的反思、阅读后的反思等各个环节进行表达表征,形成了天气观察记录、自然角观察记录、游戏故事、阅读故事等作品,并鼓励教师围绕这些作品与幼儿进行语言交流,注重一对一倾听并真实记录幼儿的想法和体验。
期刊
债券违约事件不仅影响企业的生产经营,更不利于金融市场的稳定,同时容易引发区域信用传导风险。因此,防范和化解债券违约风险具有必要性。面对高等级违约主体比例较高、展期规模攀高以及民营房企为主的债券市场违约现状,为促进企业按时完成债券展期兑付工作,增强市场和投资者对债券市场的信心,本文从政府、第三方机构和市场投资者的宏观角度,以及发债主体自身的微观角度,提出防范债券违约风险的对策。
期刊
同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是机器人自主化的关键技术。随着机器人功能与应用场景的复杂化,对系统的精度、稳定性和处理复杂环境能力的要求越来越高。目前SLAM技术的应用主要基于单传感器实现,但在复杂环境下,如带有斜坡,障碍物高度不一的场景,单传感器在定位精度、稳定性和地图完整性上存在一定缺陷。另外,二维激光雷达SLAM构建的
学位
点云配准是计算机视觉领域中一个基础而关键的方法,是从图像配准具体应用中抽象出来较为基本的问题。当前其广泛应用于医学分析、地理遥感和智能交通等领域,故对点云配准方法进行研究具有重要的理论和工程意义。关于点云配准方法,目前研究主要集中于两两配准方法,较少研究多点云配准,且现有的多点云配准算法易造成配准过程中误差积累,参考点集选取困难,从而影响配准性能。因此,本课题对多点云配准展开研究,考虑点云的真实分
学位
视觉问答(Visual Question Answering,VQA)是计算机视觉和自然语言处理领域的研究热点。视觉问答需要机器具备模拟人类眼睛的视觉能力和大脑的推理能力,不仅能描述图片内容,而且能根据用户针对性的提问做出回答,具有用户参与度。传统VQA模型对于图片的预处理是通过网格提取特征,此方法处理图片过于简单,导致提取特征往往可能会忽视主要物体;其次,视觉问答模型融合困难,迫切需要有较好性能
学位
室内定位技术是智能移动平台领域的关键技术,激光SLAM是一种应用广泛的室内主动定位技术,它具有定位精度高、不需要在环境中部署定位或通信设备的主动定位能力。2D激光SLAM方案实时性高但精度不够,3D激光SLAM方案运算量大、实时性低。因此,研究兼具精度和实时性的激光SLAM方法对智能移动平台的有效运行具有重要意义。为了提高3D激光SLAM方法的实时性,本文提出一种3D点云分区SLAM方法。该方法用
学位
运用2004年—2018年的陕西、河南和新疆等地区散养牛的成本收益数据,对比分析三区的总成本、净利润、成本利润率和成本结构差异及其原因。结果表明:三区散养奶牛的成本和收益均明显高于散养肉牛。仔畜费、精饲料费、青粗饲料费和家庭用工折价是影响三区散养肉牛成本收益的主要因素,而精饲料费、青粗饲料费、固定资产折旧和家庭用工折价是影响散养奶牛成本收益的重要因素。三区养殖保险费用的投入匮乏趋势。据此,提出了农
期刊
<正>《银行保险机构消费者权益保护管理办法》既重申了金融机构审慎经营的主体责任,又强调了对行为管理的规范化要求。监管部门应形成审慎监管和行为监管合力,推动金融机构以完善的体制机制、适当的产品和服务、规范化的操作流程、严格的关键节点控制、科学的评估体系、扎实的整改措施,不断提升消费者权益保护水平。
期刊
采用WOA13气候态季节温度数据,利用绝对梯度法对东海黑潮不同水深海洋锋的季节变化特征进行了分析,得出结论:东海黑潮温度锋具有显著的季节变化特征,它的范围和强度存在多个大值区,不同季节,温度锋的大值区存在于不同深度。在200 m以浅海域,按照冬季、春季、夏季的季节顺序,温度锋的大值区由表层逐渐增加到100 m层处;在200 m以深海域温度锋的大值区没有季节变化,大值区大约出现在400 m层附近。
期刊