物体识别中的视觉结构建模与推理研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：yujiankaka

【摘要】

：

物体识别是计算机视觉中的经典问题，该领域涵盖了计算机视觉中的物体分类、物体检测、物体匹配等任务。物体识别技术的研究为很多高层视觉任务的解决奠定了基础，同时也在工业界

【作者】

：

刘康伟

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2016年期

【关键词】

：

物体识别变形物体匹配视觉结构结构学习神经网络模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

物体识别是计算机视觉中的经典问题，该领域涵盖了计算机视觉中的物体分类、物体检测、物体匹配等任务。物体识别技术的研究为很多高层视觉任务的解决奠定了基础，同时也在工业界有着重要的应用价值。近年来，物体识别研究取得了巨大的进展，然而物体识别任务仍然是一个非常具有挑战的问题，尤其是当图像中所包含的物体存在复杂的表观和姿态变化时。本文主要研究如何利用视觉结构模型对物体进行鲁棒地描述和表达，并以此解决物体识别任务中物体的弹性变形等难题。视觉结构模型的研究在物体识别任务中有着至关重要的作用，它的研究主要包括结构建模、结构学习和结构推理三个方面的问题。在本文中，我们对视觉结构模型中的三个问题展开深入研究，并在物体的变形结构建模，模型的结构化学习以及结构模型的快速推理上提出一系列有效的研究算法。　　本文围绕视觉结构模型开展了以下研究:　　为了解决计算机视觉中物体变形等难题，本文提出了一种基于物理变形分解的结构模型。我们首先基于力学原理对物体的变形机理进行分析，并提出一种新的变形分解模型来描述和处理复杂多样的物体变形。基于所提出的变形分解模型，我们将变形物体之间的匹配任务转化为一个随机场结构模型的推理问题，并通过对随机场模型的有效推理得到变形物体之间的相互对应关系。该方法能有效地对物体复杂的变形进行表达和描述，并在不同物体识别任务（如手写体识别和物体检测）中得到很好的应用。　　为了解决物体识别任务中的结构化学习问题，本文提出了一种基于数据驱动的深度结构学习算法。我们在神经网络模型中提出了一种新的结构网络层，并通过深度学习算法对结构模型进行端到端地训练，有效地学习到物体的结构化表达和结构参数，提高了模型对于形变物体的描述能力。在不同的物体识别任务（如物体分类和检测）上的实验结果表明深度结构学习算法大大提高了视觉结构模型的结构表达和物体识别能力。　　为了解决视觉结构模型的快速推理问题，本文针对一维标号随机场结构模型提出了一种改进的广义多标号移动的推理算法。在该算法中，我们将多标号移动算法的迭代优化过程转化为一个求解集合覆盖的问题，这大大减少了不必要的标号移动数目，加快了算法的推理速度。同时，我们在理论上扩展了多标号移动推理算法的应用范围，使其可以应用于结构模型中任意能量函数的优化问题。在图像去噪和立体匹配上的实验结果表明该算法在保证算法优化效果的前提下，大大提高了多标号移动算法的推理速度。　　为了解决视觉结构模型的快速推理问题，本文针对二维标号随机场结构模型提出了一种快速的基于标号坐标下降的推理算法。该算法通过在标号空间的水平、垂直和对角方向上分别执行标号坐标下降来对二维标号随机场模型进行快速地推理优化。与之前算法需要详尽地遍历标号空间中的所有标号不同，该算法有效地利用了标号集合的二维空间结构信息，并限制随机场中的节点只能在标号空间沿一个特定方向进行移动。因此，该算法无需遍历标号空间中的所有标号，并在每次迭代优化过程中得到更小的时间复杂度。在变形物体匹配和光流估计任务上的实验结果表明该算法在保证算法优化效果的前提下，明显地提高了算法的推理速度。

其他文献

复杂工业过程异常工况诊断方法及应用研究

复杂系统异常状态的预报，一直是人们迫切希望解决的问题。为此，众多的理论研究人员与实践工作者都希望找到一些切实可行的预报方法用以解决应用中的实际问题。本文针对复杂工业

学位

复杂工业过程故障诊断解析模型人工智能人工神经网络合成氨

机械臂三维视觉伺服关键技术研究

机器人视觉伺服控制技术利用视觉传感器来获取环境信息，检测机器人执行器和目标物体当前位姿之间的相对位姿关系，并通过反馈控制使机器人执行器到达期望的位置和姿态，最终完成跟

学位

视觉伺服机器人三维视觉嵌入式系统

乙苯脱氢反应单元建模与控制

乙苯脱氢反应单元是苯乙烯装置中的重要组成部分，其作用是在高温负压并且有催化剂存在的条件下，把前部单元送来的乙苯原料转化成重要的化工产品——苯乙烯单体。目前，国内外

学位

乙苯脱氢反应反应器动态机理模型多变量协调控制分布参数系统软仪表苯乙烯

两段提升管催化裂化控制设计与分析

在SIMULINK/MATLAB环境下，利用建立的两段提升管催化裂化反再系统动态机理模型搭建了反再仿真系统。通过系统仿真实验，对反再系统的动态特性和稳态特性进行了分析和研究。在此

学位

两段提升管催化裂化反再系统机理模型控制设计

面向知识库问答的事实补全和问句解析技术研究

大数据环境下，对知识的萃取、组织和服务是解决用户精准化信息需求的一种有效途径。为此，学术界和产业界投入了大量人力物力构建数量更多、涵盖领域更广、质量更高的知识库。为

学位

自然语言处理问答系统事实补全知识表示语义解析

机器人视觉技术及实现方法研究

视觉系统对于智能机器人感知外部环境是至关重要的，它直接影响机器人的性能。虽然对机器人视觉的研究已经取得了很大进展，但是离人们的期望还相去甚远，仍有很多问题有待解决。视

学位

移动机器人视觉系统图像分割通信接口系统性能

跨模态关联学习及其在图像检索中的应用研究

随着互联网的蓬勃发展，数据呈现出爆发式增长，因此信息检索作为一个重要的数据处理技术，受到工业界和学术界的长期关注，成为一个热点研究问题。信息检索框架包含两个关键环节:数

学位

图像检索自动图像标注图像标签排序跨模态关联学习卷积神经网络

基于非线性逆系统方法自适应控制的研究

逆系统方法在应用过程中要求必须获得被控对象精确的逆系统数学模型，这个条件限制了这种方法在被控对象是随机非线性系统或者其逆系统很难精确求解的情况下的应用；针对逆系统方

学位

自适应控制非线性控制系统神经网络逆系统强跟踪滤波器STF

基于知识与数据共同驱动的植物生长建模方法研究

植物生长建模是一个涉及到植物学、数学、计算机科学、生态学等多学科知识的交叉研究领域，在农林学、计算机图形学、生态环境等学科中都具有广泛的应用前景，已经越来越受到国内

学位

知识驱动数据驱动植物生长建模有效性实用性

基于虚拟机验证的分布式软件动态部署技术研究

学位

物体识别中的视觉结构建模与推理研究

与本文相关的学术论文