基于深度学习的嵌入式实时视频结构化系统研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jst1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频是人们日常生活、工业生产以及安防领域的重要信息来源,视频结构化是计算机视觉的重要研究领域之一。视频结构化技术,就是打破视频文件的空间与时间维度,将关键信息提取出来进行扁平化展示的技术;视频结构化的过程,就是跨时间维度提取关键信息并归类的过程。在嵌入式环境下实现初级的视频结构化功能,可以在视频采集端对视频进行分析,筛选掉视频中无分析价值的时段与内容,并将筛选出的关键信息回传至后端服务器,与传送原视频相比,可以大大减少占用的网络带宽以及减轻后端服务器的运算与存储压力。近年来,随着深度学习技术的迅猛发展,一大批基于深度卷积神经网络的图像识别、目标检测、轨迹跟踪、人脸识别等算法被提出,在检测速度与准确率上相较于传统的图像处理算法有着巨大提升。同样,随着嵌入式设备与卷积神经网络加速设备的快速发展,人们可以将在GPU(计算机图形处理器Graphics Processing Unit,GPU)上训练出的大型深度卷积神经网络部署在低功耗嵌入式设备上,这使得在嵌入式平台上部署视频结构化系统成为了可能。本文首先分析了本系统所涉及深度学习相关基础理论以及卷积神经网络的构成,通过对比分析Alexnet、VGG、Resnet等主流图像分类网络以及Faster RCNN、Yolo等主流目标检测网络的算法原理、运行速度、参数体积、准确率以及嵌入式设备适用性等因素之后,选择SSD300作为视频结构化算法的目标检测网络,并探讨了不同基础网络对SSD300性能的影响,最终选用Mobilenet作为基础网络构成Mobilenet-SSD,在几乎没有精度损失的前提下,将网络的体积从105MB缩减至22MB,并采用迁移学习神经元裁剪的方法,修改了 MobileNet-SSD的网络结构,在保证准确率的前提下将网络体积再减小至Mobilenet-SSD的63.2%,进一步降低网络的参数数量与计算量。此外,为提高系统在高空俯视角度下的准确率,本文针对应用场景构建了专用数据集,对所选网络进行了适应性训练,提升了系统在应用场景下的准确率。最后,选用英特尔Up Core开发板+神经计算棒(NCS2)的硬件环境,在OpenVINO开发框架下实现了基于深度学习的嵌入式视频结构化系统,可对前端摄像头传回的视频画面进行分析,提取视频中出现的人员、车辆等物体,实现车辆颜色与种类等高级属性分析、敏感区域检测功能。经实验测得,本系统可以在在嵌入式平台实现对1080P分辨率输入视频源的20FPS的实时结构化解析,并支持将检测结果传输至后端服务器。
其他文献
金雀花王朝之所以可以统治英格兰超过两个世纪,成为英国历史上延续时间最久的一个王朝,其关键原因在于基于合法性之上的自愿服从代替了强制力量的统治。而以往的合法性研究,
马克思中学时期的三篇作文是可以考证的马克思较早的九篇文献中的三篇,文章集中表达了17岁时候马克思的理想和追求。这三篇具有非凡文笔和卓越才华的文章可以看作是青年马克
随着公路互通和城市立交的发展,为使桥梁结构线形流畅,通常需要设计大量异型桥作为主桥连接匝道的过渡桥梁。由于该类型桥结构构造往往比较特殊,会出现变宽、弯曲等情况,在力学性能方面比一般的直线箱梁桥要更为复杂,空间受力特性更为明显,这种结构和受力上的复杂性给桥梁的设计增加了一些难度。目前国内出现了一些由于支座布置不合理导致的异型桥梁支座脱空、梁体侧移、梁体翻转等严重影响桥梁安全的问题。针对这些问题,研究
目的:采用有限元分析腰椎经皮内镜双侧椎间孔一次成形对腰椎生物力学的影响。方法:选取健康成年男性1名,排除腰椎疾病。进行腰椎CT三维重建检查,获取腰椎CT数据,通过Mimics等软件处理数据,建立L4-5三维有限模型。在模拟双侧椎间孔入路腰椎经皮内镜手术过程,以圆柱体模型取代环锯,模拟环锯切除L5上关节突部分骨质进行双侧椎间孔一次成形,从而建立双侧一次椎间孔成形模型。给予相同加载条件,比较模型在前屈
<正>我国目前的求职大军中,青年人是主力。青年人面临的选择很多,关键是要有正确的世界观、人生观、价值观来指导自己做出正确的选择,这将关涉到青年自我价值和社会价值的实