监控场景下目标识别若干问题的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:poiuytrewq10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,摄像器材、高性能电子产品等硬件成本下降,在现实中的运用愈发广泛,其捕获的视频数据量也显著增多。相应地,对于监控视频数据的处理和分析系统需求日益增长,例如基于目标的监控视频摘要系统,该系统以视频中存在的行人、车辆等目标作为系统的基本单元,提取各目标包含的独特信息和事件。其中,监控场景下的目标识别技术是视频分析系统对目标后续信息提取和分析的基础,诸如增强跟踪稳健性、细节提取、异常分析等任务的效果都依赖于目标识别的性能和结果。针对监控视频摘要系统,在已有基于背景提取的监控视频运动目标检测与跟踪算法框架下,本文主要完成了监控场景下的目标图像分类、车型识别、行人重识别这三个目前亟待完成或改善的目标识别子任务:1.针对监控场景中的图像分类问题,本文使用在大规模分类任务数据集上预训练的卷积神经网络模型作为特征提取器,提取图像的描述特征。之后,本文提出了一种改进的特定类字典的稀疏表示分类模型,引入了重构残差项和重构调整项(IRRCA)。通过最小化重构残差项保证了特定类的子字典对其所属类的训练样本具有良好的表述能力;最小化重构调整项反映了由不同类别的训练样本对于某个类别的子字典重构能力较弱的特点。因此整体模型的分类判别能力得到显著提升。最后,针对监控场景中的图像分类,提出了利用该字典和表述系数的分类方法。在公用图像数据集Caltech-101和VOC2012上的实验验证了该图像分类框架的性能。2.针对监控场景中的车型识别问题,考虑到目标监控视频摘要系统的实用性,本文从包含大量中国大陆通用车型样本的Comp Car数据集中整理了用于监控场景的车型分类数据集。本文选用公认的分类性能优秀、通用性强且网络深度与模型训练速度适合的卷积神经网络模型Alex Net、Google Net、VGGNet在数据集上进行模型微调。实验结果表明,对于监控场景的车型识别任务,车辆的正侧面图像包含重要的分类判别信息。针对实验结果和车辆数据特点,本文提出了针对车型识别任务的多任务神经网络,建立了车型识别与车辆正面图像、正侧面图像视角识别任务的双输出神经网络模型。通过该模型的训练,车型分类任务的识别准确率得到提升。对比实验验证了该车型识别算法的有效性。3.针对监控场景下的行人重识别问题,本文将该任务视为一个检索问题,引入度量学习的思想,试图寻找一种有效的度量方式,使得对于一张待查行人样本图像,在使用该度量方法计算其与查询样本集中的行人图像的距离后,属于同一目标的匹配图像能排在最小的相似度距离或是前若干个最小相似度距离的结果之中。投影矩阵将不同空间目标映射到一个更容易度量距离的耦合公共空间,本文受到该方法的启发,考虑到不同空间分布样本的自相关性与互相关性度量,构建了泛化的投影度量矩阵。并使用三元组的训练样本选取方法构建相似度损失函数,一定程度消除了匹配与不匹配样本数量不平衡的问题。最后使用融合了行人图像颜色与纹理信息的LOMO特征描述行人样本。在公用图像数据集i-LIDS和VIPe R上的实验验证了该行人重识别算法的性能。
其他文献
非线性扩散反应爆破问题在化学、生物、物理和工程领域都有极其重要的应用.近年来,非线性方程解的爆破现象除了引起许多偏微分方程工作者的兴趣外,还引起了量子力学、流体力学、非线性光学等领域的工作者广泛关注.本文主要针对非线性扩散反应方程的爆破问题的有限差分方法及网格自适应算法进行研究,首先时间方向采用Crank-Nicolson格式,空间方向采用截断误差余项修正法在非均匀网格上建立了一维非线性扩散反应方
背景随着酸性、碱性化合物以日常生活用品的成分走近人们的身边,人们接触腐蚀性物质的几率越来越大。虽然一再强调这些生活用品的安全性及注意事项,无意或故意摄入腐蚀性物质
复杂系统仿真包含大量的实体,基于实体分发的负载划分技术影响着并行离散事件仿真(PDES)的运行效率。图划分算法是PDES静态负载均衡技术的重要研究方向,现有的基于图划分的静
以综合集成研讨、突发事件应急决策、作战问题辅助决策为代表的众多领域都要求仿真系统具备灵活、开放、可组合、可扩展、自适应、强交互等特性。这类仿真称为敏捷仿真。论文
我国每年都会生产大量的秸秆类废弃物,利用厌氧消化(AD)技术进行处理,不仅可以改善环境,同时还可以实现废物的资源化利用,因此意义重大。固态厌氧消化(SS-AD)技术作为AD技术
金属氧化物固溶体比单一氧化物具有更优越的物理化学性能。掺杂形成固溶体结构可以有效提高催化剂的稳定性,并可调控催化剂活性位。由于溶质掺杂量往往影响固溶体催化剂反应性能,因此我们课题组发展了简单易行的XRD外推法定量其在溶剂氧化物晶格中的含量并与反应性能相关联。基于该方法,本文测定了互溶体系Sn-Ce-O固溶体的晶格容量和晶相结构,并探讨催化剂性能的晶格容量阈值效应。为进一步完善XRD外推法用于固溶体
仿真系统初始化是仿真推演的重要环节,影响着仿真系统能否正确执行。然而随着并行仿真系统复杂程度越来越高,初始化代码的开发难度与工作量越来越大,传统手动编码的开发模式
目的:研究胃印戒细胞癌预后的影响因素以及胃印戒细胞癌中Borrmann IV型与非Borrmann IV型的临床病理特征之间存在的差异及预后。方法:收集2010年5月至2015年5月行手术治疗的
Helmholtz方程在许多工程实际问题中都有着广泛应用,如航天航空、海洋工程、以及波探测等.国内外很多研究者都对Helmholtz方程的数值解法进行了大量研究.有限差分法和有限元法都是经典的偏微分方程(PDE)数值方法,构造高精度、收敛快且针对大波数问题有效的有限差分格式具有重要的意义.本文主要针对Helmholtz方程构造了高阶混合型紧致差分格式,首先,基于Taylor展式,得到uxx,再利用
人的视觉系统能够对各种视觉特征进行处理,并表现出优异的性能。理解和模拟生物颜色视觉,以生物启发的方式提出计算模型是计算机视觉研究的一个重要内容,并且在图像处理和模