基于深层结构的图像内容分析及其应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：wangcong1001

【摘要】

：

赋予计算机以人类视觉能力的长期梦想,加上近年来图像数据爆炸式增长带来的图像管理、检索等相关应用的迫切需求,使得图像内容分析成为了视觉研究的热门课题。图像特征是进行

【作者】

：

杨奎元

【出处】

：

中国科学技术大学

【发表日期】

：

2012年期

【关键词】

：

深层结构语义区域语义特征点检测器部位码书

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

赋予计算机以人类视觉能力的长期梦想,加上近年来图像数据爆炸式增长带来的图像管理、检索等相关应用的迫切需求,使得图像内容分析成为了视觉研究的热门课题。图像特征是进行图像内容分析的基础,本质上图像特征是对图像中某些结构表观特性的总结,如颜色直方图是对像素颜色特征的总结,词袋模型是对图像块局部纹理特征的总结。然而图像中结构的总数极其庞大,如何从中选择一个有效子集提取图像特征是图像内容分析研究的重点。现阶段的图像特征主要基于图像中的浅层结构(像素、角点、斑点等)进行提取,浅层结构变化范围有限,一般可以利用人工制定规则的方法进行检测,但与语义信息关联较弱,这也造成了基于浅层结构的图像特征和高层语义概念之间的语义鸿沟问题。相对于浅层结构的深层结构一般是带有较强语义的局部图像区域(如人脸、车轮、马腿等),便于在语义层面进行图像内容分析。但深层结构存在着复杂的内在变化,一般无法通过人工制定规则的方法进行检测,往往需要借助于大量精细标注的训练数据学习深层结构模型进行检测,而直接通过人工标注这类数据极其耗时耗力,限制了其在实际中的应用。本文针对在少量监督信息情况下学习深层结构模型的问题提出了一些初步的解决方法,并基于提取的深层结构进行图像内容分析,在相关具体应用中验证了其有效性。本文的主要工作归纳如下：1.利用某些类别之间存在着相似深层结构的事实,提出了一种增量式深层结构模型学习算法。在学习新类别的深层结构模型时,借助于一些已有类别的深层结构模型作为辅助信息,在少量训练样本情况下学得该类别的深层结构模型。2.基于社交网站上用户提供的带标签的图像集,提出了一种惰性多示例学习算法进行深层结构提取。该算法将图像的标签传递到深层结构,并根据每个标签所对应深层结构的视觉属性来详细化该标签的描述,从而生成图像更详细的描述。3.提出了一种语义特征点检测器直接检测图像中语义表征力强的图像块,语义特征点检测器本质上是对图像块按语义强弱进行划分的分类器。为了解决直接按语义强弱标注大量图像块的困难,提出了一种基于弱监督信息的学习算法获取大量类别的强语义图像块,并根据这些强语义图像块对图像块空间中语义区域进行划分产生语义特征点检测器。4.提出了一种基于多层学习获取部位模型的算法,第一层用基于图像块的图像表示用仅有图像层标注训练数据的学习图像分类器,用图像分类器自动对图像进行详细标注生成与类别相关区域,作为第二层学习的训练样本。第二层通过密集匹配定义的相似性度量和聚类算法无监督地定义部位及它们的正例样本,并学习各部位的初始模型启动隐变量支持向量机进行进一步的模型优化。图像深层结构的研究,涉及到计算机视觉、机器学习、人工智能、信息检索、认知科学等多个学科,希望本文的研究工作及相关结果能够为相关领域提供一些思路和借鉴。

其他文献

对QTZ80B塔机底架与行走台车连接方式的浅析

<正> 目前,国产QTB80B塔机底架与行走台车连接结构一般如图1所示。此结构设计时,主要考虑了φ100立轴传递主动台车的水平推力,而忽视了主动台车水平推力与塔机底架反作用力所

期刊

塔式底架台车连接起重机

医药代表前途在哪

平安夜央视的药品回扣门震动全国，跟医疗有关的人都争相澄清，政府部门立即开会采取行动，唯有受影响最大的一个群体几乎没有发声，最多在微信朋友圈发几句牢骚。$$1/3药代离开医药

报纸

塔式起重机安装方案的确定及组成

塔式起重机安装方案的确定及组成河北四建三分公司解金甫为了使塔机安装工作能够安全地按期完成，必须根据施工现场及塔机的安装位置编制安装方案。１安装方案的确定１．１编制依据：（１）施工

期刊

塔式起重机安装组成

低层建筑用升降机的自动倒料机构

<正> 低层建筑使用的升降机比较简单,通常是由一个卷扬机和塔架组合而成,没有可靠的安全保护装置。故这种升降机所引起的人身伤亡事故比有各种安全保护装置的专用升降机要多

期刊

升降机倒料机构自动化

预见性护理结合认知行为干预对产妇泌乳和心理状态的改善作用

目的观察预见性护理结合认知行为干预对产妇泌乳和心理状态的改善作用,为产妇选择最佳护理方案提供依据。方法选取2016年2月~2017年2月间来本院妇产科进行分娩的足月单胎顺产

期刊

预见性护理认知行为干预产妇泌乳心理状态

语义支持的空间信息服务组合关键技术研究

空间信息服务的出现为有效解决海量、多源、分布的空间信息共享和互操作提供了一种新的方案。现实的复杂应用需求和单个空间信息服务所提供的简单功能之间的矛盾迫切需要将多

学位

空间信息服务服务组合服务语义描述服务自动分类服务链模型服务自动发现语义匹配

区域网络教研实践与探索——以重庆市渝北区为例

在当今网络技术广泛应用的条件下,重庆市渝北区以区域为单位整合各种教育资源,搭建区域教研"三维"平台,建构"三圈"教研服务网络系统,探索出区域网络教研工作方式、网络教研评

期刊

区域网络教研重庆市渝北区教研资源平台教研服务平台区域教研模式

豪宅凶猛

在美剧《纸牌屋》中有句经典台词：“权力就像房地产,位置是所有的一切,你离中心越近,你的财产就越值钱。”于是,在寸土寸金的大城市中心,人们开始追逐财富链的顶端。在上海静

期刊

联排别墅城市中心一线城市经典台词可售面积高端住宅高端人群金地集团西二环起拍价

基于双随机相位编码的图像隐藏技术研究

数千年来,信息在人类社会进步和发展中发挥了重要作用。当今,伴随着信息时代的到来,特别是80年代以来,随着计算机和网络技术的兴起与发展,信息安全问题日益凸显。基于信息光

学位

微型振动技术在搅拌机上的应用

<正> 现代搅拌站或搅拌楼选用的搅拌设备大多是强制式搅拌机。该机型具有运转平稳、噪音小、生产效率高等优点,但它有一个十分突出的缺点,那就是这种搅拌机上料斗内的细沙和

期刊

强制式搅拌机混凝土微型振动

基于深层结构的图像内容分析及其应用

与本文相关的学术论文