基于视频图像的森林烟火识别技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:zy197855
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国森林防火形势愈发严峻,森林火灾的早期识别和预警对火灾扑救至关重要。本文研究了视频监控场景下的森林烟火识别技术,由于森林烟火监控系统覆盖场景大,通常需要先分割出疑似烟火的区域,再对这些疑似区域进行烟火识别。针对森林烟火监控系统实际应用的部署环境,本文从烟火区域分割和烟火识别两个关键环节,研究了基于低速前端设备和基于高性能后端设备的森林烟火识别技术。论文主要内容如下:(1)基于低速前端设备的快速烟火识别技术。Vi Be运动检测算法应用于烟火区域分割时,存在无法适应不同景深的场景、烟火分割不准确不完整的问题。针对这一问题,本文提出了一种自适应景深的Vi Be算法,该算法根据暗通道理论,计算透射率粗略估计场景的景深信息,并通过Otsu阈值分割算法将图像按照景深分为近处和远处区域,分别设置不同的Vi Be动检灵敏度参数,提升了Vi Be算法对景深的适应性。传统烟火识别算法中,烟火区域分割不准确,导致基于图像分类的烟火识别算法无法准确学习到实际烟雾的特征,识别精度难以提升。为解决该问题,本文扩大识别算法的感受野,将基于深度学习的YOLO目标检测算法用于烟火识别问题。针对该网络规模较大、执行速度慢的问题,设计了一种改进的快速YOLO网络。该网络使用基于CBAM注意力模块和深度可分离卷积的主干网络,提升了特征提取能力和执行速度,并对候选框映射的尺度分支数进行剪枝,减小网络的规模,进一步提升网络执行速度。(2)基于高性能后端设备的烟火识别技术。本文引入基于全卷积网络的显著性检测算法,通过对图像的像素级分类,克服了传统运动检测方法无法分割出烟雾内部区域的问题。针对全卷积网络烟火分割不够准确、误检多的问题,设计了一种基于特征金字塔的全卷积网络。该网络通过不同感受野的空洞卷积得到多层特征图,并融合高维和低维特征,组成特征金字塔结构,使得网络能够感知更多周边信息,提升了网络对不同尺度烟雾的适应能力。为进一步提升烟火识别算法的精度,本文引入了Faster R-CNN网络,并对网络识别能力进行优化,设计了一种改进的级联R-CNN网络。该网络采用结合CBAM模块和聚合残差学习的主干网络,通过级联多个Io U阈值递增的检测器网络,缓解Faster R-CNN网络在训练和前向计算阶段候选框质量差异较大的现象,进一步提升算法的精度。(3)森林烟火识别软件设计与实现。根据本文研究的森林烟火识别算法,设计并实现了一个森林烟火识别软件。软件实现了低速前端设备上使用的自适应景深Vi Be算法与改进的快速YOLO算法结合的烟火识别算法,以及高性能设备上使用的基于全卷积网络的区域分割算法和改进的级联R-CNN烟火识别算法,并在视频测试集上进行实际场景测试。实验结果表明,本文设计的森林烟火识别软件能满足低速前端设备和高性能后端设备上森林烟火识别的准确性、实时性要求。
其他文献
随着物质生活的不断丰富,人们开始探索贴合人类使用习惯的人机交互技术,其中基于视觉的手势识别技术为机器理解手势提供了必要的辅助。基于图像的手势识别无需佩戴其它额外的硬件设备,与传统的输入方式相比,无需人机接触,且易于操作,在手语识别、辅助驾驶、设备控制、智能家居等交互领域具有广泛的应用。然而,目前大部分的研究仅限于光照充足的环境下,对于全天候执行的任务,特别是军事、安防领域等需要夜间执行的工作,普通
近年来我国建筑业规模持续扩张,但传统建造方式高污染、高消耗、低生产率、低标准化等问题愈演愈烈,在此期间,装配式建筑作为生产方式变革途径之一,以其低能耗、高效率的特点获得政府和行业的青睐。但随着装配式建筑在建筑市场上的比例越来越大,装配式建筑暴露的问题也越来越多,如何又快又好的推广装配式建筑成为政府和学术界关注的焦点。目前针对装配式建筑施工进度管理多沿用传统现浇建筑进度管理方法,由于装配式建筑的施工
在三维显示领域,全息显示是公认的真三维显示技术,也因其独特的波前重建技术优势被认为是显示技术发展的终极目标。随着计算机技术以及动态全息显示技术的迅速发展,计算机全息图凭借其制作简单、易于存储、用途广泛等独特的性质,逐步取代传统光学干涉法生成的全息图,解决了传统全息干涉系统复杂度高、获取困难等问题。然而计算机全息图在使用的过程中,也仍然存在着一些问题,例如散斑噪声、视场角、景深等,制约着全息显示的发
中心选址和重心选址是两种经典的选址问题,一直以来都是研究选址理论领域的坚实基础.本文基于盒马鲜生超市的选址这一实际现象的需要,同时考虑两类经典问题的要素,建立了树上三类选址问题的新模型,包括带有中心约束的1-重心选址问题、带有重心约束的1-中心选址问题和极大加和选址问题.每类问题都分为顶点型和完全型两种情况,对于顶点型的情况,选址点的范围只在顶点上;对于完全型的情况,选址点的范围可以在顶点上还可以
道路照明的目的在于为夜间在道路上驾驶车辆的人提供良好的视觉环境,使其能及时发现前方道路上出现的人或物。良好的道路照明设计可以有效地减少夜间事故发生率及事故伤亡程度,为人身财产安全提供重要保障。夜间道路照明环境的亮度一般属于中间视觉范围,目前广泛使用的研究道路照明条件下的中间视觉模型:Visibility Level(VL)模型、Relative Visual Performance(RVP)模型具
屋盖结构造型独特各异,具有重量轻、跨度大、刚度低等特点,结构对风荷载敏感,在该类结构设计中,风荷载往往起主要控制作用。屋盖结构一般为空间受力体系,自振频率密集,振型空间分布复杂,振型间具有明显的耦合效应,其风致动力特性复杂。结构节点杆件众多,所关心的目标响应也很多,传统的单目标等效方法难以实现对多个响应的等效,导致了等效静风荷载的不确定性。本文针对屋盖结构抗风设计中风致动力特性复杂、等效静风荷载不
在日常生活中,图像由于受到各种各样的影响比如,失真、模糊、噪音的干扰等,往往会丢失图像重要内容,降低了图像质量。而图像复原作为图像处理中的一个重要研究内容,通常是要进行一类不适定问题的数值求解,求解此问题最常见的方法则是基于原始图像的先验信息,引入相关正则化项,建立正则化模型。本文研究的模型为带有l1罚项的正则化模型,相比于l2正则化模型,前者对于噪音图像的复原,有更好的去噪效果。对带有l1正则化
随着我国大中城市的飞速发展,人们对于土地空间的需求日益增大,深基坑工程的开发利用也随之受到广泛关注。由于深基坑工程的复杂性,理论研究不够健全,因此工程监测成为深基坑工程安全施工的重要保障。本课题应合作单位的要求,利用传感器以及通信技术,并基于SSM框架研究并设计了一套深基坑工程监测系统,研究重点偏向于系统的整体搭建以及功能的实现。首先介绍了课题的研究背景和意义、国内外研究现状以及本课题的主要研究内
视觉多目标跟踪技术作为图像处理最热门的研究方向之一,现已被广泛应用在智慧交通、智能监控等领域。但是考虑到跟踪场景中目标尺度多样性、跟踪对象数目变化、跟踪身份误变换等问题,本文从目标检测、跟踪模型建立、目标轨迹管理、数据关联、关联线索进行深入研究,主要完成了以下工作:首先,完成多尺度行人检测算法设计。对比分析当前常用检测算法存在的不足,选择以YOLOV3为基础的检测算法框架进行改进,依据分类准确度和
近年来,生物识别技术在生活、金融、法律、刑侦等应用场景中的需求越来越高,而人脸识别技术以其特征信息丰富、便于采集和高精度等优点成为最受欢迎的生物识别技术。实际应用场景中的人脸识别系统多为小样本问题,即人脸数据库中的每个人脸类别仅能采集到少数样本,我们统称这一类问题为小样本人脸识别问题(FFR)。通常,人脸图像的采集是建立在非可控自然条件之下,往往带有光照、表情、姿态、遮挡等多种变化,因此,复杂变化