论文部分内容阅读
随着“平安城市”、“智慧城市”等重大工程的建设不断深入,公共安全的意识也越来越深入人心,智能视频监控技术的迅速发展,使得实时监控社会公共安全变得更加便利。针对特定行人的智能监控视频检索问题,已经成为计算机视觉领域的研究热点,这种在无重叠多个监控设备环境下针对特定行人的检索问题称为行人重识别。然而,行人重识别问题面临着巨大的挑战,这是由于受到光照、视角、姿势等因素变化的影响,同一行人的外貌特征发生了明显的变化。距离度量学习和稀疏表示广泛应用于行人重识别问题,本文结合这两种方法和多视图学习的方法,充分考虑行人图像不同特征之间的差异和对识别匹配的不同影响。本文的主要研究内容如下:1.提出了一种基于多视图核化特征的距离度量学习方法。首先,分析了已有的基于入侵者的距离度量学习方法存在的局限性,即对错误匹配对和正确匹配对的约束不够完善,在此基础上提出了入侵者对称性约束的距离度量学习方法。然后,结合核方法和多视图学习,将原始的线性不可分的特征核映射到可分性较好的非线性特征空间,并且对于全局特征视图和局部特征视图学习不同的入侵者对称性约束的距离度量。最后,考虑不同的特征视图对识别匹配的不同影响,为不同特征视图学习不同的识别匹配的权重,通过加权距离的方法进行匹配。2.提出了一种基于多视图特征投影和半耦合投影字典学习的方法。由于不同摄像头所拍摄的行人图像的原始特征空间有着不一致的分布,并且原始特征空间包含了一定的噪声信息。为了同时处理不同特征之间的差异和不同摄像头之间特征空间的差异,为每个特征视图对应的两个摄像头原始特征空间学习不同的特征投影矩阵和半耦合投影字典,特征投影和半耦合投影字典保证在新的特征空间中,摄像头之间的差异和样本的噪声信息被减小。最后,为不同的特征视图赋予不同的权重,以多视图特征转换和加权距离的方式进行识别匹配。通过在三个数据库上的CMC曲线、训练时间等实验结果表明,本文提出的方法与其他知名的方法相比,在取得更好的识别准确率的同时,也保证了较低的时间复杂度,适用于行人重识别。