深度学习驱动的场景分析和语义目标解析

来源 :浙江大学 | 被引量 : 0次 | 上传用户:mars1998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义目标解析和场景分析是计算机视觉中重要的研究方向,其主要目的是对图像和视频中的目标和场景进行分析、理解,在视频监控、自动驾驶、智能交通等方面均有广泛的应用。语义目标解析涉及对行人、车辆等目标的检测、识别及分析过程。其中行人细粒度分析是很多计算机视觉应用的基础,其目的是将行人图像分割成语义部件,并识别其属性。场景分析主要包括对场景的深度估计、运动分析以及结构分析等。场景的深度估计是指从图像中得到场景的深度信息,有助于恢复场景的三维结构。场景的运动分析则主要是指从连续视频帧中得到光流信息,被用于运动目标的行为识别和异常事件的检测分类。因此,有效的行人细粒度分析、图像深度估计和光流估计算法具有重要的现实意义,本文也主要关注这三个任务。近年来,深度学习已在目标检测、人脸识别、场景标注等计算机视觉任务上取得突破,设计以任务为导向的网络模型受到学术界和工业界越来越多的关注。本文将针对行人细粒度分析、单张图像深度估计和光流估计这三个任务,分别提出不同的基于深度学习的模型。具体如下:1.对于单张图像深度估计任务,本文首先回顾了已有的相关方法,然后针对目前基于深度学习的深度估计模型在建模空间上下文关系上存在的不足,本文分别提出基于数据驱动的上下文特征学习模型和基于全变分模型的损失函数模型。前者通过数据学习和像素位置相关的上下文关系权值将邻域特征融合到深度值预测,而后者则能够有效地压制噪声并在保留边缘的同时使结果更加的平滑。最后本文将这两种模型融合,得到更有效的方法。2.在光流估计任务中,相对于传统的光流估计方法,基于深度学习的方法具有效率高、易扩展的优点。然而目前基于深度学习的方法并不多,同时已有的深度模型在大位移光流预测问题上存在不足。本文将提出一种基于多尺度的相关性学习的深度卷积网络结构,能够有效地处理大位移情况。在一些大位移光流数据集上,相对于基准算法,本文提出的框架的表现有很明显的改善。另外,由于预测的结果含有较多的噪声和较大的误差,本文提出将递归神经网络与卷积神经网络相结合对预测的结果进一步修正并得到更加精细的结果。3.对于行人细粒度分析任务,本文针对监控视频下的行人精细化识别竞赛,提出两种基于Faster R-CNN的模型框架,一种是在同一个网络模型中联合学习部件检测和部件属性分类,另一种则是先基于Faster R-CNN框架检测出部件位置,然后再训练另一个网络对部件进行属性分类。实验表明先检测再分类的分阶段方式能够减少类之间的干扰进而减少误分类现象。
其他文献
随着计算需求的增长,集成在芯片上的 IP核、芯片面积和功耗都在快速增加。相比2D NoC,三维片上网络具有封装密度更高、全局互联更短和通信延迟更小等特点,在可扩展性、可重用性
我们没有翅膀,我们不能翱翔,rn但是我们有双足,我们可以登攀rn一步一步,由近而远,rn跨越我们时代那阴云密布的峰峦.rn当我们所面临的各种挑战——从气候变化、不平等、贫困到
期刊
近年来,随着网络多媒体数据和数据库应用的增加,如何对这些数据进行自动分类和检索已成为一个研究热点。尤其对音频而言,由于出现越来越多在线音乐存储和音乐检索,这就需要一
去平和县坂仔镇看宝鼎金垣,是因为林语堂。宝鼎金垣离林语堂故居太近,四五百米的距离,简直就不是距离。林语堂经常去宝鼎金垣,那就不是问题,没有任何异议。林语堂的父亲林至诚,当年穿行在坂仔传教,数十公里的安厚都去过,宝鼎金垣那就是近在咫尺,林语堂肯定也跟着去过。即便不用林至诚,这么近的距离,林语堂时常跑去玩耍也是理所当然的事情。  从林语堂故居出发,沿着右边的巷子穿过去,几十米就到了“九间头”。“九间头
期刊
上海证券交易所今年7月1日推出的上证180指数顺应了市场发展的需要,也是上海证券市场发展到一定时期的必然产物和时代选择。 上证180指数在继承上证30指数编制的优点的基础
因为花事  一生能有多少时光  贴近花枝的脸  草叶牵手露水十分钟  记了一辈子  雪花的睫毛  覆盖大地  积攒了汪洋般的点滴  奔波之后  闻见风雨的香味  再听李健《贝加尔湖畔》  遥远的湖面  亲近的脸  你的波光有青春的绵延  心碎的感觉  沉醉的感觉  谁能说出你深渊的依恋  拥抱着梦境  拥抱着微风  你青草的心中荡漾天涯的悠远  思恋一生的梦呵  纯净少年  你寂立在水云交接的刹那
期刊
随着通信技术和网络技术的飞速发展和广泛应用,数字多媒体信息的存储、复制与传播变得非常方便,数字化产品的版权保护成为急需解决的问题,信息隐藏在这样的环境下应运而生。
古城湘潭曲曲巷十八号,是一个极为精致的小院,院墙很高,满满地蓄着花光树色,牡丹、海棠、萱草、牵牛、玉兰、菊花、竹子,还有一棵老梅树,梅花开出来不是红的也不是白的,而是绿的,懂行的说那是绿萼梅,名品!院门很重很黑,两扇门上分别缀着古旧色的兽头,兽口里衔着圆硕的铜环,这叫“辅首衔环”,象征着一种昔日的气派。客人来了,一摇铜环就会发出清亮悦耳的声音,叮当、叮当,金属之声溅得满巷子都是。  在上个世纪五十
期刊
随着科技的发展,人们开始提出智能工业,智慧工业的要求。三维重建作为计算机视觉的一个研究分支,在我们的生产生活中一直占有一席之地,人们利用计算机视觉系统的特点提高了生产的
会呼吸的水  湖是上帝踩在大地上的一个脚印,也是大地上的一个秘密。时间久了,居住湖畔的人也会成为这个秘密的一部分。日兮夜兮,朝兮暮兮,人成为了湖的一部分,自然也就走进了它的心。它的心里藏着许多事。譬如一群鱼的歌与哭,是怎样在寂静的夜晚荡漾成一圈圈涟漪?譬如一丛草的怕与爱,是如何在夏季葳蕤在秋季枯败?譬如一只青蛙的吟咏,一条水虫的呓语,一叶小舟的孤独,如何被夜色笼罩,定格成不可猜度的心事?  在陆上
期刊