基于分层区域合并的自然场景理解

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:angella_dj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景理解是现在计算机视觉领域的一个热点研究方向,其目的是识别出自然图像中的对象并给出对象的位置等属性信息。人们发现图像中通常会出现层次结构,即图像中的复杂对象是由一系列的简单部分组成,而这些简单部分是由更简单的小区域组成,这种一层一层的组成就构成了图像的层次结构。该结构不仅能帮助我们识别对象,还能直观地解释各个小区域是如何作用组合成整个对象的。本文方法就是利用图像中的层次结构提出的。图像首先被分割成多个小区域的集合,然后通过不断合并相邻的区域对,并为合并后的超级区域预测可能类别,直到合并出图像中的各个对象为止。最终得到一个合并森林,该森林由多棵树组成,通常每棵树对应图像中的一个对象。此时每棵树都有其可能类别,只需从其可能类别中找出最可能的类别即可,构成树结构的所有小区域所在图像中的位置即为该对象位置。本文方法可以看成为图像语义理解而设计的一种深度学习方法。具体的工作如下:(1)设计了一个机器学习模型来描述区域对的合并过程,包括如何计算区域对分数、设定合并条件、预测合并后超级区域的类别等等。(2)由于图像中相邻区域间的合并有多种可能,直接搜索计算是不可行的,我们设计了一种贪心推理方法来求解最优的合并森林。(3)对于模型中的参数学习,我们采用了最大间隔的方法。(4)采用分层区域的聚类的方法来初始化模型参数。通过对各个类别的不同大小的区域特征进行分层聚类,取聚类中心作为参数的初始值,这些初始值不仅能够获取到各个类别区域在不同阶段的一般性特征,还能帮助模型快速收敛到极值。(5)在特征提取阶段,通过利用区域内像素的特征来计算区域的特征。我们考虑了三种不同的计算方法来获取区域特征,并分别对模型进行学习和训练,进而对这三套特征的模型测试结果进行比较和分析。
其他文献
随着互联网和电子商务的迅猛发展,信息安全的重要性日渐突出。加密技术是互联网和电子商务采取的主要安全保密措施,是最常用的安全保密手段,利用技术手段把重要的数据变为乱码(加
信息作为现代企业的宝贵资源,占据着越来越重要的地位,已经成为现代企业科学管理的基础,正确决策的前提,有效调控的手段.能否拥有及时、准确、全面的信息已经成为衡量一个企
随着信息技术的发展,办公自动化系统在机构的日常工作中发挥着越来越重要的作用.人们要求办公自动化系统能适应不断变化的办公需求,能够实现人们之间的信息交换与共享、协同
图像数据挖掘是多媒体数据挖掘的一个重要的分支.由于多媒体数据挖掘对象-图像的复杂性利一般关系数据库中数据的特性在许多方面都不同,导致图像数据挖掘不同于普通数据库和
本文针对云南省公路水毁路况没有一个统一完善的管理系统,不利于公路系统对路况的管理和维护的现状,从实际情况和需要出发,为方便云南省公路局、公路总段和养护段用户对公路
本研究就是针对这一问题,通过使用参数均步长变化的方法来对循环过程进行控制,以期建立最优模型.同时通过大量的实验,开发出了一个实用化的参数寻优软件平台.在保留基本SVM算
数字眼底图像不仅能够用于诊断眼科疾病,还能为糖尿病、高血压等全身性疾病的治疗提供依据。图像处理技术能够对眼底图像中各个结构进行识别,得到重要的形态参数,辅助医生进行诊
地理信息系统和嵌入式技术是当今计算机应用领域研究的两个热点,本文通过研究嵌入式GIS平台,把这两者有机地结合在了一起.地理信息系统是一个计算机软硬件系统,这里的硬件研
本文较为全面的介绍了PGP的加密原理及其采用的密码算法,并分析了PGP存在的安全问题和针对PGP现实的攻击方法.就本文最关心的PGP中密钥的安全问题,即怎样增强PGP在私钥保护方
第三方物流是指在物流渠道中由中间商以合同的形式在一定期限内,提供企业所需的全部或部分物流服务.物流管理系统实施的主要目的是提高对客户的服务水平和降低物流的总成本,