图像标注中基于视觉和语义一致性的标签传播及其标签均衡方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:chyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的蓬勃发展以及智能手机等具有拍照功能的设备的普及,图像资源呈爆炸式增长,亟需高效的图像检索技术。自动图像标注是图像检索中的关键技术,它基于图像的视觉特征,给图像添加反映其内容的语义标签。互联网图像资源数据海量且样本质量参差不齐,为了实现对图像的高效标注以及处理样本标签失衡问题,本文研究图像标注中的标签迁移算法,着重针对最近邻标注模型中的标签传播和标签均衡问题展开研究。主要工作包括:1、提出了一个视觉-语义分布式词向量生成方法。图像标注中,标签的分布式词向量无法表达标签间的视觉相关性,导致图像的分布式词向量视觉相似和词向量相近不一致。本文将图像的视觉类别信息融入分布式语义词向量,得到图像标签的视觉-语义词向量,在最近邻图像集中根据图像在视觉-语义词向量空间的距离进行标签迁移。同时,针对原始数据库标签失衡的问题,提出一种联合语义和视觉信息的最近邻图像选择方案,使得选出的最近邻图像集中每个标签出现的频率分布均衡。在Corel5K数据库中的实验结果表明,与目前最近邻图像标注中表现最好的算法之一的2PKNN方法相比,本文基于视觉-语义分布式词向量的图像标注方法虽然平均查准率降低了5.9%,标签召回数减少了10个,但其平均查全率和平均数分别提升了4.2%和1.3%。2、提出一种图像非负矩阵分解的多视角一致处理方法。基于非负矩阵分解与概率潜在语义分析的一致性,对图像非负矩阵分解中的多个视觉视角和语义视觉进行一致性聚类。利用该聚类一致性,在最近邻图像集中将图像的视觉特征和标签特征联系起来进行标签传播,解决了标签传播中图像的视觉和语义的潜在关系未能得到充分挖掘的问题。同时,基于测度学习提出一个更合理选择最近邻图像的方案。针对原始数据库的标签缺失问题,提出一个基于标签上下文相关性的标签自扩展算法对标签进行扩展。在Corel5K数据库的实验中,与目前最近邻图像标注中表现最好的算法之一的2pKNN算法对比,本文基于多视角非负矩阵分解的图像标注方法虽然平均查准率降低了1.3%,标签召回数少了8个,但其平均查全率和平均数分别提升了5.2%和1.6%。
其他文献
在社会生产实践中,人们经常需要对同类的部门或单位进行绩效评价。数据包络分析是评价多输入、多输出的同类决策单元相对有效性的一种数量分析方法。由于该方法无需预先作任
GDP是衡量社会经济发展最重要的指标,反映在一个国家(一个地区)的领土范围内,所有常住单位,在一定时期内,所生产的最终产品和劳务的总量。在整个社会经济统计中,GDP核算居于
夹具的设计与制造在产品的生产周期中占有非常重要的地位,提高夹具的设计效率显的非常迫切。基于知识工程(KBE)的组合夹具设计专家系统是夹具设计领域的一次飞跃。然而,“知识
用文献资料法、调查问卷法等方法,对我国啦啦操运动项目的开展情况及现状进行分析。指出目前我国啦啦操项目在两广地区的高校开展得较普及,从参赛队伍的整体实力和教练水平看
电力牵引用的接触线在电气化铁路、城市轨道交通、工矿电气化运输和起重系统等领域有着广泛的应用,在国民经济中占有相当重要地位。但这些具有复杂几何形状的异型接触线无论品
目的探究甲基强的松龙冲击治疗小儿重症过敏性紫癜的临床效果。方法选择2013年12月至2014年11月我院收治的43例小儿重症过敏性紫癜患者,根据自愿原则将其分为观察组与对照组
信贷配给理论的演进过程形成了研究的理论基础,纵观大量信贷配给理论文献,发现该理论发展比较零乱,有必要对其进行梳理。从信贷配给理论发展回顾可看出,信贷配给对经济增长的
计算机网络技术、视觉图像处理技术和深度学习的发展,为我们解决图像特征提取和图像分类提供了越来越多的解决方法。面对海量的数据图像信息,如何对其进行有效的图像分类与标
模具企业的生产车间属于JOB SHOP(单件车间)类型,用于生产加工路线不同的专门产品。基于交货期的模具车间作业调度问题是解决不同类型工件的加工排序,使其误工最少。本文首先讨
目的:评价吉非替尼门诊治疗晚期非小细胞肺癌的疗效及毒副反应。方法:对72例化疗失败或不能耐受化疗及不愿接受化疗的经病理或细胞学证实的晚期NSCLC患者给予吉非替尼250 mg,