【摘 要】
:
近年来,公共场所中人群聚集、异常事件引起的事故频繁发生,由此带来的安全问题已经受到社会和政府的高度重视。因此,对利用智能视频监控技术提高实时监控的水平,有着迫切的需求。论文针对监控视频中的公共场所的人群,展开光流估计研究,挖掘人群的运动特性,辅助进行人群智能分析任务中的群组划分和异常事件检测。论文主要工作如下:
提出了基于无监督学习的迭代残差细化光流网络。在Irr-Pwc的基础上,引入了注意力机制进行遮挡检测的优化,并设计了相应的无监督损失函数,避免了光流标注。通过在Sintel数据集和Kitt
论文部分内容阅读
近年来,公共场所中人群聚集、异常事件引起的事故频繁发生,由此带来的安全问题已经受到社会和政府的高度重视。因此,对利用智能视频监控技术提高实时监控的水平,有着迫切的需求。论文针对监控视频中的公共场所的人群,展开光流估计研究,挖掘人群的运动特性,辅助进行人群智能分析任务中的群组划分和异常事件检测。论文主要工作如下:
提出了基于无监督学习的迭代残差细化光流网络。在Irr-Pwc的基础上,引入了注意力机制进行遮挡检测的优化,并设计了相应的无监督损失函数,避免了光流标注。通过在Sintel数据集和Kitti数据集中的实验,表明了本算法在现有算法中具有竞争力。利用该算法对图像对进行光流估计,为群组划分和异常事件检测提供光流图。
提出了时空信息辅助的群组划分方法。为了增强特征的提取和利用,引入了密度图、光流图进行辅助;利用多层次语义信息进行多视角聚类的相似图构造;对多视角聚类中相似图的相关性计算进行了改进。实验结果证明了本算法能够准确划分出场景中的群组,且在CUHK人群数据集上取得了相较对比算法更好的结果。
提出了基于双流模型的弱监督异常事件检测方法。为了减少对视频中异常事件标注的依赖,设计了基于双流模型的对RGB图像序列、光流图序列进行处理的时空特征提取器,提取到的特征图进行注意力权重加权后用于事件分类,用注意力权重和时间梯度类激活映射(Tgrad-CAM)来进行事件的定位。在THUMOS14数据集和UCF-Crime数据集中的实验结果中验证了本算法在事件分类和时间框定位上的有效性。
其他文献
临近空间飞行器的控制问题是航空航天领域的热点问题,由于其具有强耦合、大扰动、非线性和快时变等特点使得其控制器设计也是一个难点。本文针对临近空间飞行器的姿态控制,在考虑系统不确定性和约束等问题的情况下,结合神经网络设计了不同的控制器。
首先建立飞行器的数学模型。结合飞行器所处的飞行环境,从运动学和动力学两个方面建立了临近空间飞行器的基础数学模型。紧接着分析了模型不确定性并建立了含有不确定性的飞行器数学模型。在考虑系统的不确定性的情况下,设计了基于神经网络的动态面控制器。对于系统的不确定性做了简化,
目标跟踪技术是计算机视觉领域的重要分支,在智能监控、自动驾驶和军事国防等领域有着广泛运用,具有重要的研究意义与实用价值。其中,以相关滤波为基础的传统和深度跟踪算法成为近年来的热点研究方向,许多研究人员对其进行深入研究,取得了大量研究成果。但与此同时,其仍然面临着诸多挑战,在实际复杂应用场景中受到目标自身内部因素和环境外界因素等干扰,固定的跟踪模型往往难以应对跟踪时变因素(目标形变、目标遮挡、复杂背景等)带来的挑战。本文针对传统相关滤波算法和孪生网络系列跟踪算法跟踪模型自适应问题展开研究,并面向实际应用需求
水面无人艇是一种水面智能设备,其在执行各项海事任务或靠岸停泊时,需要实时感知周围环境的信息。而水面环境除了存在船只、浮标等具有目标性的物体,还存在岸体、码头等不具有目标性的物体,现有的基于目标检测或者海岸线检测的方法不能完整地解析出这些物体的信息。而语义分割是对图像像素级的分类,不受物体外观形状的影响,可以有效解析出水面环境中各类物体,为水面无人艇提供丰富准确的环境信息。因此,本文以无人艇应用需求为牵引开展了图像语义分割相关技术的研究。
本文提出了一种基于多向卷积的上下文信息融合方法。上下文信息
随着卫星和遥感技术的发展,遥感影像的数据量也越来越庞大,超出了任何人工操作和处理的范围。因此,遥感图像的自动分析使这些图像在城市资源管理、搜索、海洋监察、海洋资源管理等实际应用中发挥重要作用。同时由于传感器技术的进步,获取到的遥感影像的空间分辨率不断变高,使得定位各类目标(比如,飞机、船只、车辆、港口等)成为了可能。然而,光学遥感影像不可避免地会受到各种因素影响,比如目标密集排列、外观相似和目标较小的影响,导致检测算法性能下降,给光学遥感图像的目标检测带来了较大的挑战。
针对地面目标密集排列的情
场景理解是计算机视觉中重要的研究课题,被广泛地应用于机器人自主导航、自动驾驶、无人机和盲人辅助系统开发等领域。场景中的深度信息和语义信息是场景理解的关键,对于单张RGB图像而言,可通过单目深度估计和语义分割来分别获取像素级别的深度信息和语义信息。近年来,基于深度学习的单目深度估计算法和语义分割算法取得了不俗的成绩,但是由于场景的复杂性和多样性,仍面临着诸多挑战。针对目前仍存在的一些问题,本文做了以下研究工作:
针对单目深度估计和语义分割这类像素级密集预测任务,本文设计了一个端到端的基于全卷积网络
【摘 要】略读课文是语文教材重要组成部分。长期以来,略读课文教学上处在比较尴尬的处境,语文教师在教学略读课文时,或把略读等同于精读,精雕细琢;或置之度外,过度放手,凡此种种均没能正确把握略读课文的特点,发挥其在提高学生阅读能力上作用。思维导图的引进,能够更有效提高略读课文教学的有效性。本文以人教版语文第十一册《索溪谷的“野”》为例,谈谈思维导图在语文略读课教学中的运用。 【关键词】略读课文;思维
人类对海洋资源需求与日俱增,船舶作为开发和利用海洋的重要工具,对海域船舶进行监测管理显得尤为重要。论文以大幅面海面遥感图像为载体,提出了一种先预分类后检测的两阶段船舶目标检测算法。该算法具有准确率高、速度快的特点,为实现海域船舶监测提供有力的支持。论文主要工作如下:
首先,不同于一般通用目标检测任务,大幅面遥感图像目标检测具有图像幅面大、目标小且尺度变化范围大、背景干扰严重和计算量大的特点。本文提出了一种先预分类后检测的两阶段大幅面遥感图像目标检测算法,采用“分而治之”的思想,将大幅面遥感图像切
图像语义分割是计算机视觉中的一个基本任务,其在自动驾驶、地质检测、精准农业等领域有重要的应用价值。随着RGB-D传感器的出现,由于其采样得到的深度图像蕴含场景的几何结构信息,有助于目标的分割,基于RGB-D的语义分割很快成为本领域新的研究热点。本文致力于如何将深度图像蕴含的几何结构信息引入到卷积神经网络(Convolutional Neural Network, CNN)中,以改造标准卷积,得到几何可变形卷积,达到提升分割性能的目的,主要研究工作简述如下:
(1)提出了基于先验的几何可变形卷积神
近几年,自动驾驶技术逐渐成为学术界和工业界研究的热点话题。在自动驾驶系统中检测到目标并精确感知目标的距离信息,这是保证无人驾驶安全性的关键。本文采用3DmAP作为性能的技术指标,针对基于点云三维目标检测的相关问题开展研究,利用二维图像与点云融合来提高三维目标检测的性能;利用三元注意力和粗精两级回归网络提高三维目标检测的鲁棒性,同时保证目标检测的速度和精度。
首先,提出了一种基于视锥下尺度不变和特征权衡的三维目标检测的方法。该方法针对直接在点云中进行三维目标检测消耗大量的搜索空间的问题,将二维图像
计数在农业生产中扮演着重要角色,是产量预估、发育期观测、植物表性分析等一系列任务的核心所在。随着科技进步,诸多农事操作逐渐由机械取代了人工,但是国内外田间作物计数依然依赖于人工。这种人工计数耗时耗力、低效易错,且会对作物造成不可逆的损伤。更为关键的是人工计数无法方式满足现代农业中大尺度、高吞吐量数据分析的需求。为了提高生产率、解放劳动力,近年来有不少自动化解决方案被提出。然而,大部分方法的研究对象处于可控环境,因此往往无法有效的应用于实际的无约束田间环境。为了更好的解决无约束田间条件下的目标计数问题,论文