基于语义场景分类与多视角学习的图像自动标注方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:dxlwwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,数字图像的数量呈爆炸式增长,海量数据的管理需要一个有效的浏览、分类和搜索系统。自动图像标注技术用于为图像分配标签以获得更准确的检索、分类结果;图像表示通常有多种,融合不同的特征能够提供更好的表征能力,提高图像标注、分类算法的效果。本文就是对自动图像标注算法以及多视角特征学习进行研究。现存常见图像标注方法可以分为两类:基于搜索数据库的方法和基于模型学习的方法。基于搜索数据库的方法利用数据库中已标注的图像直接提供标签候选序列,具有简单、有效的特点,近些年得到广泛应用。然而此类方法一方面忽略标签之间的共现关系,导致了较低的准确率,另一方面在大数据集中此类算法是低效的。基于模型学习的方法中,自动图像标注问题可以看作多类别分类问题或者针对每个标签的二分类问题。此类方法大都没有考虑标签之间潜在的场景信息,当数据集标签数量巨大时,则意味着巨大的分类输出空间,从而导致此类方法不再适合。针对在图像标注问题中没有考虑标签与语义场景间的映射关系以及存在的标签硬分类问题,本文基于非负矩阵分解提出了一种标签的语义场景划分方法,实现了标签与语义场景间的概率映射。继而利用场景分类找到样本语义相关的场景,最后在样本语义相关的场景中利用KNN-based算法完成图像标注。实验表明,本算法不仅提高了算法效率,同时提高了标注效果。由于不同特征对不同的语义概念有不同的表征能力,所以图像分类、标注算法通常都基于多种不同底层特征。多视角特征的引入在提高了算法效率的同时,也增加了算法需要处理的特征维度,影响了算法效率、降低了算法可用性。现存多特征融合、降维算法通常属于无监督学习方式,没有利用到数据集中已存的标签信息,因而导致了新特征不能有效得蕴含样本之间的语义关系。针对上述问题以及图像标注问题中样本含有多个标签的特性,本文提出了基于多视角特征和图嵌入的半监督图像标注算法。首先,该算法通过建立新的基于图嵌入的多视角NMF算法模型,对多视角特征进行融合、降维,然后通过KNN-based算法利用新的特征实现图像标注。实验表明,该算法在保证标注效果的同时提高了算法效率。
其他文献
定位理论是广告学和市场营销学中最重要的理论之一,其主旨认为任何一个品牌(产品、服务和企业)都必须在目标受众的心中占据一个特定的位置。对此实务界进行了广泛的应用,并取
随着我国经济的高速迅猛的发展,中小企业开始在经济的浪潮中扮演着越来越重要的角色。中小企业在我国社会经济发展中更是有着举足轻重的政治和经济地位。据有关部门统计显示
“V/A+死+了”这一构式表达意义多样,生动形象,因而是现代汉语口语中最常用的构式之一。但是,之前对该构式的研究大多停留在语义、语用和语法化层面,并没有找出该构式意义发
阐述医院图书馆嵌入式服务的背景与方式,分析嵌入式服务馆员培养存在的结构不合理、层次不高、人员编制少等问题,提出对馆员培养的素质要求及改进途径。
目的:通过对96例青年女性黑眼圈求美者随机采用“艾灸法治疗”或“微针法治疗”或“空白对照治疗”,观察研究验证祖国医学中艾灸疗法与微针对青年女性黑眼圈临床疗效的对比及
随着科学技术的发展,很多形状复杂、尺寸及表面精度要求较高的黑色金属零件应用越来越广泛。但是,由于加工黑色金属材料时,刀具磨损较快工件表面粗糙,被公认为“难加工”材料,限制
本文以红色题材连环画为研究对象,详细阐述和总结了以中国共产党和在中国共产党领导下的中国人民的光辉奋斗历程为题材的连环画这一艺术形式的发展过程和现状。以及笔者创作的红色题材连环画的创作过程的分析与总结。本文分为四个部分,第一部分:概括总结了从公元一千年前至明清时期这一时间段内连环画的起源与发展过程;第二部分:详细阐述了从抗日战争至中华人民共和国成立之前红色题材连环画的发展过程,并举例分析了这一时期几
现代工业对电阻点焊接头质量的要求越来越严格,从而要求对点焊过程与质量必须采取更加精确的控制方法,以提高焊接接头的可靠性。本文针对传统点焊控制器电流控制精度不高的缺点
语言入学准备是预测幼儿后续学业成绩的有力指标之一,幼儿语言入学准备的水平与家长的努力密不可分。本研究通过方便取样,以宁夏银川市某公办幼儿园的大班幼儿和家长为对象,
本文通过查阅近十几年来发表的文献资料以及一些参考书目,对常微分方程在数学建模中的应用进行研究。本文首先介绍了常微分方程的发展,然后介绍了数学建模,接着介绍了二者相