论文部分内容阅读
随着科技的进步及智慧城市的推进,各种视频监控系统已深入人们的生活,产生了海量的非结构化视频数据。本论文以实现基于目标对象的全景视频智能检索系统为目标,研究多镜头全景视频拼接技术、目标检测及目标重识别技术,以云计算为支撑实现对海量全景视频数据中目标对象的快速检索。针对以上关键技术,本论文深究了多镜头全景视频拼接技术,提出了应用分层匹配进行配准并基于变化检测来更新每一帧的视频拼接方法;基于视频目标检索技术是通过对运动目标进行检测提取研究对象,并对检索出来的运动对象进行特征提取与描述,从而对运动对象进行识别分类,其中在运动目标检测阶段本论文分析了经典ViBe算法存在的缺陷,并提出了基于背景平稳特性的ViBe背景建模方法;在目标检索阶段,本论文重点研究了行人的重识别问题,为解决度量学习过程中存在过拟合的问题,提出了基于负样本对双阈值约束的度量学习算法。主要创新点如下:(1)在多镜头全景视频拼接方面,针对具有一定视场重叠的摄像机固定拍摄的视频由于存在视差而造成拼接容易产生鬼影和拼接缝扭曲的情况,且不能满足实时性要求的问题,本论文提出一种应用分层匹配进行配准并基于变化检测来更新每一帧的视频拼接方法,分层匹配比仅使用一个全局投影变换矩阵更能适应层次丰富的复杂场景的配准,基于重叠区域变化检测的帧更新方法可通过检测图像重叠区域的变化情况按需更新拼接线,从而在保证视频拼接效果的同时,也能保持较高的效率。实现结果证明,基于分层匹配进行配准的方式很好的解决场景中存在复杂的深度分布而引起深度失真的现象,基于变化检测的拼接缝更新能有效的消除鬼影及误匹配现象,该成果发表于“Botao He,Shaohua Yu.Parallax-Robust Surveillance Video Stitching,Sensors,2016,16(1):7~19”。(2)针对目标检测算法中,经典的ViBe算法在背景模型初始化时存在运动物体和检测过程中目标由静止变为运动都易出现Ghost现象,而导致消融速度慢的问题,以及原目标易被检测为多个目标而导致目标分裂的问题,本论文针对ViBe算法单帧图像初始化出现Ghost现象的问题进行研究,基于短时间内背景像素沿时间变化为一平稳过程这一假设,提出了基于背景平稳特性的ViBe背景建模方法,该方法采用连续帧来完成背景模型的初始化,在背景模型更新阶段结合了ViBe随机更新方式和像素点的历史信息。实验证明,文中的方法在满足实时性的同时,有效的抑制鬼影现象,在静态场景中有很好的鲁棒性,提升了目标的检测准确性,该成果发表于“Botao He,Shaohua Yu.An Improved Background Subtraction Method Based on ViBe.7th Chinese Conference on Pattern Recognition(CCPR 2016).2016.Part I”。(3)在目标检索阶段,针对现有行人重识别在运用度量学习过程中,为了使正样本对特征距离小于负样本对特征距离,过度约束负样本对的距离尽可能大,而造成过拟合现象发生的问题,本论文提出了一种基于负样本对双阈值约束的度量学习算法,该方法通过对负样本对进行双阈值分割约束,能学习到更多行人图像间本质的区别,显著降低由于训练样本受限、样本受噪声和背景干扰等影响引起的过拟合,具有更强的泛化性。实验证明,对于负样本对之间过大的特征距离进行双阈值的约束,在VIPeR、PRID450S、CUHK01及Market1501数据集上准确率分别提升了0.82%、3.60%、6.21%及13.03%,证明了该方法约束条件对于度量学习模型优化的有效性,该成果发表于“Botao He,Shaohua Yu.Ring-push metric learning for person reidentification,Journal of Electronic Imaging,2017,26(3):033005-1~033005-10”。