基于卷积神经网络的视频密集群体行为识别

来源 :南京邮电大学 | 被引量 : 1次 | 上传用户:crazyapple123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频群体行为识别是计算机视觉中一个具有挑战性的任务。由于场景变换、复杂的人群分布、透视效应等问题给人群密度分析、人群检测以及群体行为分析带来了诸多的研究难点,卷积神经网络为上述难点提供了可靠的解决方案。本学位论文以群体密度分析与视频中的群体行为识别为目标,首先设计一种基于深度分离空洞卷积神经网络的人群密度估计方法,然后设计一种基于密度图回归引导分类的人群检测与定位方法,最后设计一种基于密度等级划分的人群行为分析方法完成人群密度分析与视频群体行为检测。本学位论文的创新工作如下:(1)提出一种深度分离空洞卷积神经网络模型,用于在人群高度密集场景下的人群密度分析与人群计数。深度分离空洞卷积可以更有效的提取图像多尺度的特征,并利用空洞卷积神经网络在不增加参数的情况下扩大感受野,并加入分离层以及呈锯齿状的空洞率克服空洞卷积的网格效应,提高模型的计算效率,生成高质量的人群密度图。在Shanghai Tech_A/B数据集,UCF-CC-50数据集上对该模型进行评估,实验结果表明该模型预测误差较小,预测得到的人群密度概率图质量高并且与真实的密度图像分布相似。(2)基于深度图像使用深度自适应高斯函数生成人群密度图,利用深度图像覆盖人群密度图输入Retina Mask目标检测网络,使用目标检测网络中不同的解码层检测不同尺寸的头部,并通过人体头部的深度信息预估头部尺寸大小,初始化锚点信息,估计头部检测边界框大小,进行人体头部检测与定位,提高了目标检测网络的分类速率,有效的解决了人群密集场景下小尺寸头部的漏检问题。在MICC数据集和Shanghai RGBD数据集上对该方法进行验证,实验结果表明该方法可以检测到较小尺寸头部,有效提高检测的准确率与检测速率。(3)对于视频人群密度等级进行划分,在人群密集度较低的场景下基于视频获取时间信息和空间信息构建时空关联模型进行群体行为语义抽取,在人群密集度较高的场景中基于人群密度图结合卷积神经网络模型对人群的异常聚集和分散行为进行检测与预警,检测异常聚集的人群人数、地点,检测异常分散人群的人数、地点和分散速度。在Volleyball数据集上验证了稀疏群体行为检测的有效性,在PETS 2009数据集上对人群异常运动行为进行检测,实验结果表明该方法检测精度高并能准确定位异常发生的位置。
其他文献
“安全生产”是当前我国社会经济建设与发展的基本保障,对企业而言,“安全生产”更是企业发展的重要基础,只有抓好安全生产工作,才能确保企业经营的持续健康发展。同时,安全生产也是企业文化建设的重要组成部分。“安全第一”是一个永恒的话题和主题,企业只有安全的发展才是健康的发展、和谐的发展。随着我国政府对“安全生产”的重视度越来越高,安全生产教育培训市场也越来越广阔,与此同时,安全生产教育培训公司在前所未有
随着网络多媒体技术的高速发展,高清及超高清视频的应用逐渐普及,大量视频数据的产生给视频存储及传输带来了巨大挑战。在此背景下,视频编码联合工作组(Joint Collaborative
对公共政策可信的评估为政府决策和公众参与提供必要的依据。社会实验通过随机分配的方法将社会实验的参与者分成实验组和控制组,进而考察社会项目对参与者的影响,是进行公共
<正>目的:探讨儿童主动脉瓣病变的临床病理特征,进一步提高对儿童主动脉瓣病变的认识。方法:对 2003年1月至2005年12月70例患儿行外科手术切除的主动脉瓣标本进行大体观察和
会议
<正>酒美网从进口红酒垂直电商演进到O2O并向红酒投资延伸,实现了战略"三级跳",并在保真、性价比和信息载体三个方面实现了突破。未来的战略方向是在实现用户规模后向"非标品
陕甘宁边区银行在抗日民族统一战线的条件下,坚持独立自主的货币金融工作方针,先后发行光华商店代价券(简称光华券)、陕甘宁边区银行币(简称边币)和陕甘宁边区贸易公司商业流通券(简
<正>女子铅球作为多次在奥运会和世界大赛中取得优异运动成绩的我国优势运动项目,受到人们的广泛喜爱和关注。众所周知,动作技术是保障运动员运动素质发挥的基础,没有合理的
会议
长期以来,传统融资渠道存在的融资难和融资贵问题严重束缚了小微企业的发展。互联网金融为小微企业提供了新的融资渠道,互联网融资门槛低、成本低、便捷高效,有助于小微企业
目的探讨血清胎盘生长因子(PLGF)在预测早发型子痫前期(PE)中的应用价值。方法选取2016年1月到2017年8月我院收治的36例早发型PE患者为观察组,选取58例同期在我院体检的正常