基于深度学习的行人检测和视频浓缩研究

来源 :山西大学 | 被引量 : 4次 | 上传用户:nmcflyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,随着深度学习的快速发展,行人检测和视频浓缩已经成为视频监控分析领域研究的焦点。行人检测是计算机视觉中的一项基本研究,它的主要任务是分析视频图像中是否含有目标行人并对行人进行准确定位。视频浓缩技术是将原视频中的主要内容浓缩成方便人们浏览的浓缩视频,在公共安全领域,为维护社会治安发挥了不可替代的作用。本文的主要研究内容如下:目前实时检测行人算法在遇到人群相互遮挡情况时检测性能很不理想,为解决此问题,将排斥损失函数应用于Faster R-CNN进行行人检测。该排斥损失函数由两个因子组成:其中一个为行人间的相互吸引因子,另一个为与周围其他行人的排斥因子。排斥因子阻止行人候选框转移到周围行人使得在人群中的行人检测鲁棒性更强。实验结果表明,通过排斥损失训练的行人检测算法在人群行人检测当中有着明显改善,得到了较高的检测准确率。针对现实复杂环境中行人检测出现的准确率低和漏检率高等问题,将图像HOG特征与深度学习特征相结合应用于行人检测。首先通过统计图像中像素点的梯度信息以及使用ZF-Net特征生成网络得到行人边缘描述算子HOG特征和行人深度语义特征;然后,利用候选区域生成网络对上述两种特征进行处理并输出多种尺度和宽高比的行人候选区域;最后,使用Fast R-CNN网络对这两种特征和行人候选区域进行处理。在INRIA和Caltech数据集上的实验结果表明,与目前主流算法相比,该行人检测算法在背景复杂情况下可以成功地检测出行人。针对视频浓缩时运动物体之间的相互遮挡和背景的复杂性使得难以准确提取运动物体而导致浓缩比降低的问题,提出了一种基于交互机制卷积双流融合神经网络的视频浓缩方法。首先,对输入的视频帧进行感兴趣区域选取;然后,使用卷积双流融合神经网络分流提取运动物体特征和背景特征并进行特征融合,以减弱运动物体之间相互遮挡的影响;最后,通过交互机制将融合后的特征进行关联性运算,以有效提高运动物体之间及运动物体与背景之间的相关性,再根据相似矩阵进行场景聚类得到关键帧。实验结果表明,通过该网络结构进行视频浓缩,浓缩比和召回率都有所提高。
其他文献
本文研究了鞍点问题的迭代法.在Benzi等人提出的维数分裂(DS)迭代方法的基础上,提出了具有三个参数的广义维数分裂(GDS)迭代法,该方法包含了DS迭代法,理论分析表明该方法是无
"花开盛世—中国美术馆藏花鸟画精品展"作为中国美术馆2018年跨年大展,将馆藏的百余件花鸟画精品亮相于观众。在展厅中,这些作品按照时间的顺序被分为三个篇章:第一个篇章"托物言
传统木构农房承载着居民的生活和珍贵的民族文化。实木资源的稀缺,以及生活方式的改变加之传统民居在热工性能、防火、抗震等方面存在不足,使得传统木构民居在现代适应性改造
大数据时代产生的海量数据存在着大量冗余。数据去重技术可以有效地消除冗余数据,从而获得学术界和工业界的广泛关注与应用。但是数据去重技术计算开销过大,会对存储系统性能
英语听力教学在高中阶段英语教学中占有重要比例,根据2003年普通高中英语课程标准的要求,高中阶段英语听力教学应该立足于培养学生的以下能力:学生能够抓住听力语段中的关键
【正】 寿险营销是一种以个人寿险消费为主,通过销售人员直接的、面对面的向消费者提供保险咨询服务,让消费者在充分选择的基础上购买保险的营销方式。这种以个人人寿保险消
韩国农林渔业食品部(MIFAFF)水产养殖处于2012年5月16日发布了G/SPS/N/KOR/414号公告,标题为:水生生物疫病控制法案执行法令和法规。
运用高压溶液法对磷化渣进行3次提纯,获得高纯度的磷酸铁样品,采用扫描电子显微镜、X射线衍射仪对其进行表征。比较3种低分子有机酸(甲酸、乙酸、草酸)、混合酸及硫酸对纯化
动态评估(Dynamic Assessment,以下简称DA)源于维果斯基社会文化理论中的“最近发展区”(Zone of Proximal Development,ZPD),运用干预活动将评估和教学有机整合,从而使教学
圆锥曲线中的定点、定值问题的求解一直是自主招生、竞赛、高考命题的热点之一,命题角度广,备受命题者青睐.而且圆锥曲线中的定点或定值问题形式多样,花样翻新,要求较高,但其