基于分类和检测统一框架的图像物体识别研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：aminhao

【摘要】

：

图像中的物体识别是计算机视觉领域中的一个核心任务。它是很多计算机视觉应用的基础，对人类视觉系统的深层理解具有重要作用。物体识别通常分为两个基本问题，即物体的分类和检

【作者】

：

王冲

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

图像处理物体分类物体检测识别技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像中的物体识别是计算机视觉领域中的一个核心任务。它是很多计算机视觉应用的基础，对人类视觉系统的深层理解具有重要作用。物体识别通常分为两个基本问题，即物体的分类和检测。在人类的认识系统中，物体的分类和检测互相依赖，他们共同形成物体识别的整体。近年来随着深度学习技术的发展，相比传统方法物体识别的精度和规模也被很大程度的提升。然而在取得成功的同时，也发现目前的物体的分类和检测大多是独立来考虑的，并没有形成一个相互依赖的整体，这造成了信息的浪费。同时，由于数据量的爆炸式增长，数据的标注问题给当前的物体识别算法的进一步增强和扩大带来了新的挑战。因此，充分挖掘物体分类和物体检测之间的关联性也成为当前物体识别的重要课题。围绕物体分类和检测的统一，本文开展了以下工作:　　1.我们研究了物体识别中物体特征的鲁棒表达以及高阶关系模型。物体的特征表达是物体分类中的重要因素，在经典的视觉词典模型中主要包括特征编码和汇聚两个步骤。基于当前提出的各种特征编码和汇聚方法，我们对二者的组合进行系统性探索，发现了一些有趣的规律并给出了在各个应用场景中的使用指导。此外，为了克服目噪声对物体特征表达的影响，我们通过对物体进行特征表达的高阶关系建模，得到了更为鲁棒的特征表达，能够有效改善物体分类算法的效果。　　2.我们研究了基于视觉通路反馈的鲁棒物体识别方法。物体识别包括两个基本任务，即物体分类和检测，许多研究都是将二者分别考虑。然而生理学实验表明，分类和检测存在着信息的交互，即每个任务将信息反馈到另一个任务以达到增强识别的目的。基于此，我们提出了基于视觉通路反馈的鲁棒物体识别方法，设计了视觉通路反馈原理的计算模型，分别利用物体显著性和物体结构实现分类和检测通路的反馈，使得物体识别可以较为有效的克服物体本身的各种变化以及复杂背景的影响。　　3.研究了面向弱标注和噪声标注的物体检测算法。传统的物体检测需要大量的人工对训练图像中物体的类别和位置进行标注。然而真实应用场景中，物体位置的标注需要极大的资源花费。基于此，我们提出了基于隐式语义学习的弱监督物体检测方法，利用语义分析描述未标注样本之间的相似性，挖掘出可能的物体类别和背景类别，并用于在弱标注和噪声标注下的物体检测，使得物体检测的性能在只给定少量标注以及大量噪声标注的情况下都得到了大幅度提升。

其他文献

水下机器人路径规划三维动画演示程序设计

水下机器人作为重要的潜水设备,它的研究不仅有重要的经济意义,也是军事与政治斗争的迫切需要.而路径规划问题是机器人朝智能化发展的瓶颈问题.该文针对水下机器人路径规划的

学位

水下机器人路径规划动态模拟显示虚拟现实

基于粒计算的不确定性度量与特征选择方法研究

作为知识表示和数据挖掘的重要工具，粒计算是解决大规模复杂问题时模拟人脑思维自然模式的一种新的理论、技术和方法，在大数据挖掘的研究中有着独特的优势。粒计算模型中的知识

学位

数据挖掘粒计算理论不确定性度量特征选择

基于递归神经网络的污泥膨胀智能预测方法研究

随着污水排放总量的增加，污水处理厂的数量在不断增加，目前大部分污水处理厂都采用活性污泥法。而对于采用活性污泥法的污水处理厂来说，污泥膨胀是将要面临的严重危险之一。污泥

学位

污水处理厂污泥膨胀智能预测递归神经网络

基于神经网络模型的非线性预测控制算法的研究

该文主要针对参数时变的时滞非线性系统研究有效的神经网络预测控制算法,着重对神经网络预测控制的预测模型、优化控制器和反馈校正方法进行了分析研究.文中的预测模型由离线

学位

时变时滞非线性系统神经网络模型直接优化预测控制反馈校正

88B炮控系统的控制算法研究

该课题是"九五"国防科研项目"新型坦克炮控系统技术研究"的子任务.该文的基本目标是:针对88式坦克炮控系统存在的非线性因素影响,设计炮控系统的控制算法.结果表明,采用带自

学位

炮控伺服系统非线性因素非线性控制模糊控制滑模控制跟踪一微分器系统仿真

基于对象技术的Internet系统的研究及其优化实现

在开发"高校研究生、博士后Web信息发布系统"的过程中,该文首先研究了分布式对象和WWW技术,以及这两个技术的集成-面向对象的Internet技术,然后基于该技术和IBMS/390大型机

学位

分布式对象技术Internet技术主动数据库分布式查询优化算法

一种基于FPGA/CPLD的视频会议终端机的实现

"视频会议系统"是近年来发展起来的最先进的将图像、声音等资料进行异地传输的会议系统设备.视频会议系统旨在为分散于不同地区的多个用户提供一个很好的讨论环境,使人们足不

学位

视频会议系统视频编码小波编码复接公用交换电话网

基于B/S体系结构的管理信息系统的研究和实现

管理信息系统(MIS)是现代管理科学与计算机科学结合应用的产物,网络技术、数据库技术、通信技术的飞速发展MIS不断变化,科技的进步使得MIS业已成为信息社会中不可或缺的管理

学位

管理信息系统客户/服务器中间件浏览器/服务器数据库

校园网设计与实现

该课题主要研究了网络技术在校园网中的应用,它的设计与实现技术为一般校园网的升级提供了一种可行方案.该文通过对国内外最新的计算机网络技术如快速以太网、ATM网技术、千

学位

校园网交换机网络管理网络管理协议管理信息库(MIB)

多媒体邮件业务档案查询系统

该文对如何建立邮件档案管理信息系统来海量存储邮局邮件业务档案,使一定容量的存储体能够存储更多的邮件档案,并实现邮件档案的快速查询进行了深入的分析和研究.该文阐明了

学位

管理信息系统数字图象压缩压缩率邮件业务

基于分类和检测统一框架的图像物体识别研究

与本文相关的学术论文