基于视频监控的遮挡人员检测算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:jackwang02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉技术的飞速发展和监控系统的广泛应用,通过对二者进行结合而衍生出的智能视频监控技术也不断取得进步,其中人员检测任务又是智能视频监控领域的一个重要主题。目前主流的人员检测方法主要基于图像进行检测,算法的效果直接影响到整个智能视频监控系统的实用性,因此设计一个高精度、鲁棒性好、高效的人员检测算法显得尤为重要。现有的人员检测算法在检测过程中面临着诸多因素的干扰,其中遮挡问题是一个研究的重点和难点,也是制约人员检测率提升的主要因素之一,基于此本文提出了一种适用于遮挡环境下的人员检测算法。算法以实时性较好的Yolov3网络为基础,在原网络的多尺度输出分支上设计并添加中心点预测分支,通过对待检测图像中人员目标的中心点进行预提取来实现相互遮挡目标之间的分离,从而降低距离较近的人员目标之间的相互干扰。另外,对网络训练的损失函数进行优化,整体的损失函数通过中心点预测损失和边界框回归损失聚合而成,其中边界框回归损失采用广义的交并比(Generalized Intersection over Union,GIo U)指标进行构造,以提高边界框的回归精度。最后,针对人员检测任务设计更符合人员目标特点的锚框,提高对数据集的拟合能力。鉴于实际监控场景的检测任务,通过提取大量的实际监控视频自建了一个包含16832张样本的多场景人员检测数据库(MHDD)用于验证算法的性能,同时通过Caltech-new行人数据库验证算法在行人检测任务上的性能。实验结果表明:算法在MHDD上的检测精度为94.48%,漏检率为5.25%,同时检测速度达到了28fps(帧/秒),保证了检测算法的准确性和实时性。另外,在Caltech-new数据库上的测试漏检率为6.02%,进一步保证了算法在行人检测任务上的准确性。
其他文献
武汉东湖风景名胜区是典型的城市型风景名胜区,为进一步提升景区的品质,将东湖打造为世界城中湖典范和世界级城市生态绿心,武汉相关部门结合《武汉东湖风景名胜区总体规划(2011—2025)》开展了东湖风景名胜区喻家山服务区详细规划的编制工作。文章以东湖风景名胜区喻家山服务区详细规划为例,在分析服务区现状的基础上,提出了“完善保护区划、加强生态保护,强化功能结构、提升空间环境品质,突出东湖水域特色、明确功
期刊
基于植被净初级生产力和覆盖度的植被生态质量指数构建方法,对长白山自然保护区2000—2021年植被生态质量变化情况进行评估分析。结果表明:长白山自然保护区是吉林省绿色程度较高、生态环境好的区域,植被覆盖度和年净初级生产力总体呈上升趋势;生态质量指数随着海拔的升高而降低,2000年以来,植被生态质量指数总体呈上升趋势;96.6%的区域植被生态质量在持续提升,特别是西南坡增幅显著,生态质量变差区域主要
期刊
现实生活中,交流过程不止有说话声,更是充斥着各种各样的噪声干扰着沟通质量。因此,如何更好地抑制噪声对沟通的影响性,是一个急需解决的问题。语音增强是为更好的解决噪声对交互影响而出现的技术,主要目标是增强混合语音中的目标语音,从而在一定程度上使得增强后语音更易于理解。传统的语音增强只能较好的应对平稳噪声,对于非平稳噪声效果往往不太理想,最近深度学习的崛起在很大程度上解决了对非平稳噪声的抑制。由于频域处
学位
目标检测一直是计算机视觉领域比较典型的研究问题,在实际生活和工业场景中也得到了越来越广泛的应用。但是,由于目标检测中存在一些问题对于其性能提升造成了阻碍,比如:多尺度目标特别是小目标、目标之间相互遮挡、复杂环境的噪音干扰。因此,针对以上问题,本文从复杂场景及小目标两个方面着手进行了研究。论文的主要工作如下:1、针对多尺度目标检测任务存在小目标检测准确率不高,召回率较低的问题,提出了一个基于双通道注
学位
随着机器学习和深度神经网络两个领域的迅速发展以及智能设备的普及,人脸识别和分析技术正在经历前所未有的发展。目前,人脸识别和分析精度已经超过人眼。此外,人脸表情识别(Facial Expression Recognition,FER)作为人脸识别和分析技术中的一个重要组成部分也已经达到了前所未有的精确的效果,但对于复杂环境下的人脸表情图像(有遮挡、低分辨率、有额外噪声),想要达到同样的精确的识别结果
学位
为了提升石油烃污染土壤的修复效率,考察了不同表面活性剂(吐温-80 (Tw-80)、曲拉通X 100 (TX 100)、十二烷基硫酸钠(SDS)、十二烷基苯磺酸钠(SDBS))对过硫酸钠氧化土壤中石油烃的强化效果,并分析了表面活性剂SDS强化修复效果较优的原因。土壤中石油烃的去除率遵循如下趋势:SDS>SDBS>TX 100>Tw-80。SDS强化修复效果较优可能与其在土壤中吸附量较小对石油烃的增
期刊
通过眼球捕捉的视觉信息是人脑认知世界、感知周围、捕捉外界信息的重要途径之一,随着眼动跟踪设备的不断完善,使用眼动数据分析人脑认知的方式越来越受到研究人员的关注。然而目前对眼动数据的研究主要是从“自底向上”的角度分析,缺乏对“自顶向下”因素的讨论与定量化分析计算。本文主要从“自顶向下”的角度对多目标跟踪过程中的凝视控制进行分析,探究了人脑完成多目标跟踪任务中进行的注意力分配过程,并研究了条件熵与凝视
学位
在21世纪的今天,人工智能蓬勃发展,而神经网络模型技术的逐渐成熟在其中起到了关键性的作用。神经网络模型作为一种特征提取器在多个研究领域都展现出了强大的性能。这主要是因为它对复杂函数有着强大的拟合能力,并且参数越多拟合能力越强。因此网络结构被设计的越来越深、越来越宽。然而,模型的训练和测试不仅要占用非常多的存储空间,还对设备的硬件有较高的要求。这给神经网络模型在边缘端设备上的部署造成了非常大的障碍。
学位
本论文探讨了基于虚拟现实技术的急救护理教学模式及其效果评估。首先介绍了虚拟现实技术在护理教学中的应用,指出传统教学模式存在的问题。随后详细讨论了基于虚拟现实技术的急救护理教学模式的设计原则和构建要素,并结合实际案例进行说明。接着介绍了急救护理教学模式的实践应用过程和步骤,并提出了虚拟现实技术在急救护理教学中的应用效果评估方法。通过实验设计和数据收集,对教学模式的效果进行评估和结果分析。最后进行讨论
会议
在异常数据检测中,由于数据量过大和数据特征维度过高,往往会导致数据标定困难、数据冗余、算法效率降低等。针对以上问题,将主成分分析(PCA)特征选择算法与深度自编码高斯混合模型(DAGMM)相结合,提出一种新的无监督异常数据检测方法 PCA-DAGMM。该方法首先利用PCA特征选择算法对数据进行预处理,去除对分类效果增益较小的冗余数据,降低运算成本;然后将特征选择后的数据输入到DAGMM模型中进行训
期刊