【摘 要】
:
随着社会和科技的不断发展,对于监控视频场景的智能分析系统的需求也不断的上涨。在众多的监控视频分析功能中,对视频中的人员进行定位以及计数是一个重要的研究方向。本文基于深度学习的理论,利用多任务学习的方法设计了一个可用于图像中人员定位以及计数的多任务学习模型,然后结合后处理算法进一步提高系统的精度。本文主要进行了以下的工作:1)对系统应用场景的视频数据做了收集、划分、标注,从图片数据的场景出发,说明了
论文部分内容阅读
随着社会和科技的不断发展,对于监控视频场景的智能分析系统的需求也不断的上涨。在众多的监控视频分析功能中,对视频中的人员进行定位以及计数是一个重要的研究方向。本文基于深度学习的理论,利用多任务学习的方法设计了一个可用于图像中人员定位以及计数的多任务学习模型,然后结合后处理算法进一步提高系统的精度。本文主要进行了以下的工作:1)对系统应用场景的视频数据做了收集、划分、标注,从图片数据的场景出发,说明了采用基于人体目标检测模型的原因。针对传统标注方式速度慢的问题,本文通过半自动化的标注方式可以快速获得本文训练所需的人体包围框以及掩码标注数据,包围框可用于目标检测任务训练,掩码可用于人体实例分割以及语义分割训练。2)从多任务学习的思想出发,引入实例分割以及语义分割任务进一步提高人体检测精度。为了使得网络能够高效地完成实例分割任务,本文在原有的基于关键点检测的网络基础上引入额外的掩码特征分支以及控制器分支进行条件卷积操作,以此输出不同实例的掩码。同时,本文进一步引入了语义分割分支来进行学习。为了实现人员定位以及计数任务,本文通过实验分析了检测结果最佳的筛选阈值,并且在最佳阈值下对人员计数以及定位指标做了测评。通过检测精度与定位和计数精度的比较分析了检测性能与定位与计数性能间的关系。3)针对图像目标检测模型无法充分利用视频时序信息的问题,本文引入了热图扩展算法在后处理阶段融合了视频时序信息,进一步提高了所提出模型的定位以及计数性能。通过实验确定了热图扩展算法的最佳超参数。此外,针对部分目标易被误检的问题,本文引入了掩码非极大值抑制算法,通过实验对比说明了掩码非极大值抑制算法相比于边界框非极大值抑制算法的优势。4)基于多任务学习模型与后处理算法,本文设计了一个可对多路视频流进行人员定位以及计数的应用系统。该系统可对视频场景中的人员离岗行为进行报警,从而实现更好地预防因人员擅自离岗造成的事故。
其他文献
胶囊内窥镜是一种重要的医学诊断工具,它本质是一个微型摄像机,医生通过拍摄的图像进行疾病诊断。但是在进行检查过程中,会存在一些问题。患者吞服胶囊后,患者和医生不能马上离开,因为胶囊可能滞留在胃部,所以需要医生确保胶囊进入小肠后患者才可离开,这个时间可能长达两小时。同时医生需要人工监测胶囊位置,记录胶囊进入小肠时间,显然对于医生来说这是一个枯燥的工作。另外,胶囊内镜会拍摄数万张图像,医生需要逐一阅读每
随着互联网和大数据的发展,图像日益丰富并成为人们社交生活的一部分。在通讯、监控、遥感、医疗等领域,图像都是重中之重。可由于硬件领域摩尔定律限制、拍摄条件和环境的变动,得到和保存的图像往往存在问题。一是图像有噪声、模糊,二是纸质图像老旧后会出现褪色、划横,三是图像尺寸可能太小。为解决上述问题,近年来基于神经网络的图像超分辨率重建和修复技术层出不穷。图像超分是指从一幅或多幅较低质量的图像中产生高质量图
通信系统受到外界因素影响,导致接收机接收到波动较大的信号,为了实现基带信号的正确解调,需要在接收机中加入AGC自动增益控制电路,通过增益补偿的方式达到信号稳定输出的目的。本文提出了模数混合AGC系统的设计方案,该结构利用FPGA完成数字处理模块的设计,并将转换为模拟信号的控制电压反馈到可变增益放大器VGA,通过控制VGA的增益调整输出功率。本文主要工作内容如下:(1)本文描述了模数混合AGC系统的
行人跟踪是智能视频监控中的研究热点,对行人的跟踪广泛应用于安防、人流量计数等场景中。基于视频图像的行人跟踪,通常作为行人检测的后端应用与行人行为识别判定的前端应用。一方面,行人跟踪可以更好地协助判定与预测行人的行为动作,以此实现行人动作识别、预警功能;另一方面,行人跟踪可以更好地协助抓取行人的关键信息,人脸图像通常作为行人的身份信息进行识别,但是需要抓取到相应行人的有效人脸图像,则需要使用行人跟踪
交通车辆目标的分类识别是城市智能交通管理系统,辅助决策自动驾驶以及综合交通信息平台的核心支撑技术。近年来伴随雷达技术不断提高以及各种新技术不断涌现,车辆目标识别技术逐步由基于光学传感器的图像处理技术转变为气象与环境适应性更强且性能更可靠的雷达探测技术。如今利用雷达进行探测的车辆目标分类技术已成为热点。基于统计模型的传统雷达目标分类识别技术因模型失配的原因存在分类可靠性差、正确识别率低等方面不足。深
随着当今社会的快速发展,各行各业对能源的需求也在不断提高。石油资源作为最为重要的资源之一,得到了各国的重视;如何勘探并开采石油资源,一直是各国研究重点。自Thompson于1936年在试验中发现了震电信号的存在,震电效应逐渐成为了地下资源勘探中的研究热点。相较于声波测井,震电测井检测的是电磁波信号,受钻铤波影响较小,因此展现出了在地质勘探方面的潜力。然而,激励出的震电信号一般较为微弱,而信号幅度能
随着微波毫米波器件逐步朝着高性能的方向发展,其边界及材料结构也变得愈加复杂。传统的解析方法只能在特定的坐标系以及规则的形状下求解麦克斯韦方程,因此它能够解决的问题十分有限。此后研究人员开始借助计算机及数值分析方法来进行数值求解,目前较为通用的方法是依靠电磁仿真软件及其内部的局部优化算法来完成器件整体的设计流程。但是此种方法的自由度受限,只能对已有模型进行有限的局部优化,当引入多自由度的复杂边界进行
在物联网的日益发展中传感器技术不可或缺。传感器能够感知外界环境的变化,在越来越多的场景中扮演着人类感官、神经、大脑的角色。热释电红外(PIR)传感器是众所周知的占位探测器,已被广泛用于人体跟踪和目标检测系统。目前,红外传感微系统等传感设备都需要通过电池等外部电源供电。但是,对于一些特殊工作环境,会因为电力系统故障等原因造成传感系统无法正常使用。为了解决在偏远地区或野外环境中难以使用传统电力供电的问
阵列天线是由多个辐射单元排列而成,若其中某些阵元失效将会导致阵列性能下降。为了保持阵列的辐射性能,对阵列进行定期或实时的故障诊断尤为重要。本文以基于辐射远场信息的阵列故障诊断方法为研究课题,从多标签分类的角度建立诊断模型,结合机器学习相关技术,对基于多标签深度学习的阵列故障诊断方法以及基于迁移学习的平面阵诊断网络展开研究。本文的研究内容主要包含以下三个部分。1.现有的基于机器学习的阵列故障诊断方法
随着网络化应用程度的加深,互联网+、大数据等技术的发展迅猛,现代社会也会产生大量多维度多属性的数据,例如医疗图像数据,工业传感器数据,高光谱图像数据等,传统的低维信号已经不能表现这些数据多个属性的内在联系,所以这些具有高维特征的数据集一般都用张量来表示。张量作为向量和矩阵在高阶空间的延伸,是这类数据十分本质的表达。张量奇异值分解(T-SVD)是一种新颖的分解方法,可以通过傅里叶变换把数据从时域搬移