【摘 要】
:
随着城市化进程的快速发展,更多的视频监控摄像机安置在城市的各个角落,由此产生了海量的视频监控数据。对视频中关键信息的获取和分析已经不能单纯的依靠人力来完成,将深度学习技术应用到多摄像机监控中能够带来极大的便利。视频数据结构化能够提取单个摄像机视频监控的行人序列信息,行人目标再识别能够将不同摄像机中的相同行人目标进行匹配关联,从而能够实现多摄像机监控中行人综合信息的获取。本文将深度学习技术结合到多摄
【基金项目】
:
广东省深圳市知识创新计划基础研究项目——“结合深度学习的多摄像机网络智能视频监控关键技术研究”;
论文部分内容阅读
随着城市化进程的快速发展,更多的视频监控摄像机安置在城市的各个角落,由此产生了海量的视频监控数据。对视频中关键信息的获取和分析已经不能单纯的依靠人力来完成,将深度学习技术应用到多摄像机监控中能够带来极大的便利。视频数据结构化能够提取单个摄像机视频监控的行人序列信息,行人目标再识别能够将不同摄像机中的相同行人目标进行匹配关联,从而能够实现多摄像机监控中行人综合信息的获取。本文将深度学习技术结合到多摄像机监控任务中,针对行人再识别这一问题进行研究工作,本文取得的研究成果如下:首先,设计了用于深度学习的行人再识别数据集标注软件并生成了行人再识别数据集,为再识别工作的展开提供了数据支持。本文采用人在环中的智能标注思想,采用深度学习技术对不同摄像机中获取的行人序列信息进行自动匹配,人工对匹配的结果进行确认和矫正,并且利用标定好的数据集对深度学习模型进行增强学习,从而提升行人再识别数据集的标注效率和准确性。使用该标注软件对录制的行人视频进行标注,生成了行人再识别序列数据集以及倾斜姿态的行人图片数据集。其次,提出了结合深度学习与行人倾斜姿态矫正的再识别方法,用于解决再识别过程中多摄像机间行人姿态倾斜的问题。在再识别之前的图像预处理阶段,采用深度学习方法将再识别的行人目标进行实例分割并且获得目标行人的边界信息,用主成分分析方法获得行人的偏转角度并且将行人进行姿态矫正,从而实现不同摄像机视场中行人姿态的对齐。然后用深度学习网络提取姿态矫正后的行人特征,通过距离度量,获得行人再识别结果。实验结果表明,该算法能够有效的将倾斜行人进行姿态矫正,在再识别任务中取得较好的表现。再次,提出了结合深度学习与摄像机网络拓扑的行人序列再识别方法,缩小了多摄像机间行人序列再识别查询范围,实现了行人序列的再识别。通过摄像机间的行人信息推断出摄像机网络拓扑,在再识别过程中通过摄像机网络拓扑生成候选行人,再通过查询行人序列特征与候选集序列特征进行DTWT距离的度量,从而得到再识别结果。实验结果表明,该方法减少了行人再识别候选集,实现行人序列特征矩阵的有效度量,提升了行人序列再识别的速度和准确性。最后,设计并实现了行人再识别云平台实验系统,将结合深度学习的再识别技术融入到多摄像机监控系统中。在云平台上部署Restful Web服务器,将前端计算节点提取到的行人结构化序列信息保存到云服务器的数据库中,在云服务器上实现行人图片再识别、行人序列再识别的功能,最后在客户端上进行展示。本文成果对多摄像机智能监控技术的研究和应用具有较大的参考价值。
其他文献
本文研究了超奇异同源图以及同余方程λ1x1k1+…+λtxtkt≡c mod n解的计数两个问题.第一章,我们首先简单回顾了超奇异同源图的研究背景以及已知的研究成果,并且介绍了我们在同源图中Fp点处得到的结果.其次我们回顾了同余方程解的计数问题,并且介绍我们的主要定理.第二章,我们回顾了代数数论,椭圆曲线和复乘,以及Deuring对应的基本理论.第三章,我们介绍了超奇异椭圆曲线同源图的定义gl(F
随着网络技术的不断发展与进步,光通信系统需要更高的通信带宽与速率,这些新的挑战给光通信领域带来新的发展机会。可调谐激光器在光通信、传感等领域有着重要的作用。而光通信系统面临光信号处理与分析的新挑战,对激光器的线宽也提出了新的要求。可调谐窄线宽激光器也是高速相干光通信系统中的核心光电子器件。本论文基于重构等效啁啾技术设计并制作了双段式HR-AR镀膜激光器及其阵列,并研究了一种压窄可调谐激光器线宽的新
燃料电池被认为是21世纪以来最有前景的新能源技术之一。然而,燃料电池阴极的氧还原反应过程非常迟缓,高度依赖Pt贵金属催化剂,而由于Pt贵金属储量不明且年产量较低,这严重阻碍了燃料电池的大规模商业化应用。如今Pt-M合金体系成为燃料电池催化剂研究的热点,Pt-M合金体系不仅能有效降低电极Pt载量使燃料电池的成本显著下降,同时合金的形成调整了Pt的d带中心,优化氧还原过程中催化剂与氧的结合能,从而带来
激光雷达相对于传统电磁波雷达,具有测量范围广、测量精度高、抗干扰能力强、体积小等优点,在现代社会中实现了广泛应用,大量应用于军用和民用领域。低成本、高精度、小体积、可集成是激光雷达目前的主要发展方向,半导体激光器具有工作稳定性好、体积小、波长范围广、工作寿命长、可直接调制等优点,成为了激光雷达系统的理想光源。双频半导体激光器作为激光雷达测速和测距的光源,具有测量精度高、抗干扰、便于集成等优点,应用
多标签文本分类是指一个文本实例可以同时关联一组标签集合而非单个标签。随着数据的爆炸性增长,基于深度学习的多标签文本分类已经成为该领域的一个研究热点。深度学习中的注意力机制广泛应用于多标签文本分类中,并为所有的标签学习出唯一的特征表示。由于不同的标签蕴含不同的语义信息,文本中的同一单词应当被不同标签赋予不同的关注度,然而传统的注意力机制未能考虑这一问题。随着标签数目的增加,利用标签关系可以有效缩小标
在这个万物互联的时代,车辆成为第三大联网设备,车联网技术受到学术界和工业界广泛关注。车联网以信息通信技术为核心,集成了通信、传感、定位等多项前沿技术,能显著提高行车安全和效率。由于用户需求的多样性,车联网中存在多种不同制式的网络。另一方面,由于车辆用户节点具有移动速度高、随机性强的特点,会导致在不同网络间产生大量切换,从而降低用户的通信质量。因此,如何在保证车辆用户服务质量的前提下,减少不必要切换
目前机器学习在数据分析领域有广泛应用。特别是在医疗领域,机器学习算法可以辅助医生进行诊疗,既提高了效率又充分发挥出了医学大数据的价值。例如,在乳腺癌临床诊断数据分析中就常用到机器学习算法中的聚类算法和分类算法。同时,随着医学数据规模与日剧增,机器学习算法应用愈加广泛,云计算技术将有效助力于大数据的存储与计算。然而云服务器一般被认为是不完全可信任的,将医疗数据外包至云进行存储与计算具有隐私泄露风险,
不孕不育是当今世界面临的最为重要和最紧迫的问题之一,影响了全球10-15%的育龄夫妇。其中,近一半的不育症与男性因素有关;而在男性不育的发病中,多种遗传因素涉及其中。本论文旨在鉴定和研究新的导致男性不育的基因突变和染色体异常,并确定Exo5基因在小鼠精子发生中的作用。第1部分:我们招募了一个原发性不育的巴基斯坦近亲家系,该家系具有三位不育的男性患者。精液分析显示不育患者表现为轻度至重度少精症,而且
异构社交网络是一种包含不同类型的节点和边的社交网络,它不同于传统的同构社交网络的地方在于它包含着许多的语义信息。异构社交网络上的链接预测是指根据异构社交网络所提供的拓扑信息和语义信息来预测两个节点之间形成边的可能性。元路径是一个以节点为端点、节点和边交替出现的序列,它是异构社交网络中常用的拓扑信息和语义信息提取工具。因此,本文的研究重点是探究如何更加高效地使用元路径来提取和利用异构社交网络中的拓扑
随着“智慧城市”建设的不断推进,人们对公共安防提出了高效化、智能化的要求。传统的人工方式已难以处理日益增长的监控数据,因此需要一种能对监控视频结构化数据进行自动化提取与管理的方法。本文以行人视频数据结构化为中心,结合深度学习相关算法,分别从数据集智能标注、行人属性信息的精细化提取与描述、多目标关联与跟踪方法以及视频结构化系统设计四个方面展开工作,取得了如下成果:1)为了满足行人视频数据结构化过程中