基于深度学习的目标检测技术的研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户：sbt200905

【摘要】

：

在图像信息快速膨胀的今天,如何快速有效的对静态图像进行标注,从静态图像中检测和定位出目标类物体,是机器学习和计算机视觉领域中最基础大挑战之一。目标检测技术是指从静

【作者】

：

刘博

【出处】

：

北京邮电大学

【发表日期】

：

2016年01期

【关键词】

：

目标检测深度学习卷积神经网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在图像信息快速膨胀的今天,如何快速有效的对静态图像进行标注,从静态图像中检测和定位出目标类物体,是机器学习和计算机视觉领域中最基础大挑战之一。目标检测技术是指从静态图像中检测和定位出一般目标类。这个问题在技术上很难有效实现,主要存在这几方面的原因,一是因为很多目标物体类可以在外观上有很大不同,这些变化不仅仅是由于光照和角度不同引起的,而且还取决于非刚性变形,不如同样是汽车,会有不同的形状变形。近几年来,目标检测技术的性能发展变得很缓慢并已经停滞不前。目前性能最好的目标检测系统都是一些很复杂的整合系统,这些系统结合从目标检测符提取的多种低层图像特征和从场景分类器获得的高层语境。由于这些系统很复杂并且只是基于SIFT或HOG这些手工设计的低层图像特征,所以不能够准确、快速地检测和定位目标类。在本论文中,我们深入分析了深度卷积神经网络在静态图像中目标检测技术研究中的应用。结合候选区域提取,模型微调和特征提取的概念,解决了深度卷积神经网络模型在与分类任务不同的数据集上的训练和优化问题,提出模型微调的方法,设计了三种不同深度,不同规模大小的卷积神经网络,先训练预训练模型,然后再进行模型微调,最后使用微调后的深度模型进行目标检测。本文中的目标检测算法能够准确检测图像中的一般目标类,可以准确地定位出一般目标类,这也间接证明了深度模型具有比较强的泛化能力。在目标检测过程中,将引入一些图像切割算法,如selective-search算法,应用于前期针对图像切割出很多图像子区域,在本文中称之为候选区域,这些候选区域中可能存在着需要检测的目标类。此外,这些识别出的候选区域会通过一个训练好的区域回归器,得到更接近真实物体所在的区域。我们针对深度模型的内部特征不透明,网络过于抽象,不利于研究人员对深度模型进行训练和优化的问题,本文设计了一种类似反卷积网络,将高层特征重构到RGB颜色空间,实现对深度卷积神经网络的可视化技术。我们从中了解到不同层所学习到的特征各有不同。所以提升深度模型性能的关键就是,如何有效的分析和利用深度卷积神经网络所提取的特征,分析出所需要优化的地方,然后再对深度卷积神经网络进行优化。我们基于以上针对基于深度学习的目标检测技术的研究,报名参与了2015年的Imagenet Large Scale Visual Recognition Challenge 的竞赛,在ILSVRC2014 Object Detection任务的数据集上,实现了单一模型在detection任务测试集上取得mean AP指标42.3%的优秀成绩。目前结果还在提交过程中。

其他文献

我们需要更理性看待人工智能技术

错误的推测会导致人们对那些不会发生的事情产生恐惧,比如机器人会造成大规模的失业,甚至是机器人会反抗人类等。我们需要更理性看待这些技术,避免错误的预测。我们需要反思一下为什么会出现这些错误的推测?Rethink Robotics的联合创始人、主席兼首席技术官Rodney Brooks概括了主要的七点:高估和低估Roy Amara是美国未来研究所的联合创始人。他提出了一条著名的法则,被称为阿马拉

期刊

博世力士乐与埃斯顿合作智能工厂项目正式投产

近日,由博世力士乐中国与埃斯顿共建的机器人智能工厂项目正式宣布投产。该项目实现了机器人本体生产的自动化、信息化,标志着国产机器人的工程化和产业化水平迈上新的台阶。

期刊

WILA中国智能模具新品首发

2019工博会上,WILA开展了一场别出心裁的新品发布会,首次发布了智能模具相关的产品:带DM(Data Matrix)码的WILA智能模具、带蓝牙通讯的WILA智能夹紧系统、折弯模具智能选型顾

期刊

夹紧系统蓝牙通讯新品发布会智能选型工博会

以实验为中心的发现法初探

化学是一门以实验为基础的学科。演示实验在中学化学教学中占举足轻重的地位。然而传统的演示实验,却往往总是按着“教师提出问题—教师演示—得出结论”这样一个公式化的过

期刊

发现法中学化学教学实践证明元素周期律演示实验教学课堂效果电解质溶液稀硫酸氧化一还原反应思维能力

防止初中化学学习的负迁移

学生已掌握的知识,在学习新的知识时所产生的消极的、不利的干扰和影响,教育心理学中称之为“学习负迁移”。化学学习的负迁移,能导致概念混淆,严重影响学生掌握知识以及分析

期刊

负迁移初中化学纯净物混和物教学试验常规教学化学教科书化学教师核电荷数拿得出

高性能数控系统项目获国家科技进步奖

2018年1月8日,中共中央、国务院在北京人民大会堂隆重举行国家科学技术奖励大会。武汉华中数控股份有限公司(以下简称“华中数控”)等机床工具企业及用户企业共同完成的《高

期刊

积极打造数字化的未来——DMG MORI将携持续互联互通机床技术及解决方案亮相EMO 2019

作为全球可持续技术发展的推动者,DMG MORI服务于42个行业的广泛客户,也是全球领先的金属切削机床制造商。在即将于9月16—21日举办的EMO 2019(2019汉诺威国际机床展)上,DMG

期刊

DMGMORI应用程序门户网站机床技术EMO2019互联互通

列宁的“灌输”理论：回到历史文本中的解读

列宁十分重视意识形态领导权，他根据党的历史任务和工作重心的变化而灵活地开展“灌榆”工作，形成了系统的“灌输”理论：十月革命前，主要是思考如何教育群众、发动群众，以夺取政权

期刊

列宁“灌输”理论十月革命

用滤纸做显色反应实验三则

用滤纸做显色反应实验三则崇明马桥中学（２０２１５８）施丹一、蛋白质的显色反应：在园形滤纸上涂上鸡蛋清，然后滴上几滴浓ＨＮＯ３，等一会儿，滤纸上的蛋清很快显黄色，实验效果十分明显，也不用试管，也不需加

期刊

显色反应丹一马桥在园教学效果崇明

智造不懈创赢数字化2019

2018年对于施耐德电气而言,是硕果累累且值得铭记的一年。自2016年底在中国正式发布新一代EcoS truxure架构与平台以来,施耐德电气两年来不断深化自身在数字化领导者及行业应

期刊

施耐德电气工业互联网互联网平台

基于深度学习的目标检测技术的研究

与本文相关的学术论文