基于属性挖掘的零样本图像分类

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:huahua9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像作为信息和数据的重要载体,已广泛渗透于现代生产生活的每个环节。利用机器学习方法对海量图像进行分类等加工处理已成为当今各行业领域生产力提升的迫切需求。零样本图像分类是指在训练集有标签样本类别无法涵盖测试集所有类别的情况下,利用属性等辅助信息实现对测试样本的正确分类。零样本图像分类在当前图像涉及类别及场景极速增长、新类别层出不穷和分类精细度不断提升等背景下,具有广泛应用前景。本文针对当前零样本图像分类研究中特征-属性关系构建不全面、属性描述不充分等问题,利用弹性网约束、宽度学习和属性关系有向图等方法充分挖掘属性-特征关系、属性-属性关系、属性空间结构和属性-类别关系,提出了四种基于属性挖掘的零样本图像分类方法,主要工作如下:1.针对零样本图像分类中属性和特征表达能力不足的问题,提出基于增强属性-特征的宽度属性预测模型。首先,利用弹性网约束学习二值化的稀疏增强属性,并与手动标定的语义属性共同构成混合属性;其次,通过宽度学习的增强节点获得增强特征,对已有图像特征进行扩展;同时,采用宽度学习中岭回归的伪逆矩阵投影同步得到所有属性的预测结果;最后,通过曼哈顿距离计算预测属性与各测试类属性的相似性,实现零样本图像分类。2.针对属性描述不充分和属性与特征之间映射不全面的问题,提出基于加权重构混合属性组的零样本图像分类模型。首先,利用层次聚类对语义属性进行自动分组,然后通过宽度结构对属性分别按组进行增强,共同构成混合属性;其次,考虑属性组之间的权重关系,通过加权自动编码器实现属性空间和特征空间之间的映射;同时,在目标函数中引入结构化稀疏L21范数,去除属性冗余;最后,在特征空间计算测试样本特征和各预测类别特征的相似性,实现零样本图像分类。3.针对属性和特征之间映射不全面的问题,同时考虑合理挖掘属性空间结构,提出基于关系有向图正则化的属性三因子分解模型。首先,利用属性的矩阵三因子分解实现属性空间和特征空间的映射,将投影矩阵作为训练和测试阶段的共享因子;其次,通过加权属性之间的相似性定义权值矩阵,构建属性关系有向图;最后,在属性空间或特征空间计算测试样本和各测试类别的相似性,实现图像分类。针对投影领域偏移问题,通过同时考虑测试类别关系和测试样本分布进一步提出直推式模型。4.针对属性与特征关系缺乏考虑样本特征分布的问题,同时考虑现有生成模型中类别属性表示过于相似、测试集中生成样本和真实样本分布不一致的缺点,提出基于属性核矩阵的生成特征领域自适应模型。首先,利用核方法在语义空间计算核函数,进而构造属性核矩阵;其次,将语义属性-类别关系矩阵与属性核矩阵合并作为条件,通过条件Wasserstein生成对抗网络得到伪样本特征;然后,采用联合分布自适应方法缩小测试集有标签生成样本与无标签真实样本的边缘分布和条件分布差异;最后,利用测试集生成样本,通过有监督学习实现零样本图像分类。在公共属性数据集上的对比实验结果表明,所提算法均有效提高了不同设置情形下的零样本图像分类精度。本文研究成果不仅可以丰富现有的机器学习理论和方法,而且能够广泛推广应用到诸多相关领域,具有重要理论意义和实用价值。论文共包含图58幅,表12个,参考文献216篇。
其他文献
人体行为分析是机器视觉、模式识别、深度学习、人工智能等多个学科的交叉融合,在基于内容的视频检索、医疗辅助、人机交互、视频监控等多个领域具有广阔的应用前景。人体可
背景和目的OSAHS(Obstructive Sleep Apnea Hypopnea Syndrome,OSAHS)患者长期佩戴呼吸机的依从性差,使得其治疗有效率备受影响响。手术治疗成为许多OSAHS患者的另一种选择,术前采用药物诱导睡眠内镜(Drug-induced Sleep Endoscopy,DISE)评估上气道阻塞平面,可有效评估上气道塌陷情况,明显提高上气道多平面手术有效率。但DIS
新课程标准下注重培养学生的核心素养,全面发展学生的各方面能力。“二元导学”教学模式是以预习案与导学案为学习载体,让学生先学,然后在教师的引导下教学,侧重学生的自主学
复合化是金属材料提高力学性能的有效途径。在传统的金属基复合材料(MMCs)中,人们往往追求增强体在金属基体中的均匀分布,进而避免由增强体的团聚导致的应力集中和复合材料整
目的通过对采用直接前入路和后外侧入路行全髋关节置换术的术后早期髋关节X线片进行对比分析,从而探讨这两种入路的优缺点,为临床医生对于手术入路的选择方面提供参考。方法
作为一个民族声乐女高音,在研究生学习期间意识到了一个重要的问题,科学的发声方法是如此的重要。不能再过多的、无限量的使用自己的声带,也就是我们职业生涯中的“本钱”。我意识到,运用气息带动声带所发出的自然的物理运动,才是正确的、科学的发声方法,也可以说是一种无形的“利息”,且这种“利息”会越用越多。我们的声带在被保护的同时,不易感到疲劳,且能够演唱出更加明亮、自然、悦耳的声音。在这场音乐会当中我是这样
紫花苜蓿(Medicago sativa L.)具有适应性强、蛋白含量高、适口性好和营养价值高等特点,是全球栽培面积最大的优良牧草。由于我国草产业发展相对滞后,紫花苜蓿产量和种子严重不足,尽管进口量逐年增加,仍难满足市场需求。此外紫花苜蓿抗旱耐盐能力较弱,在干旱和盐渍化环境下难以生长,加之虫害的威胁,这严重制约了紫花栽培面积的扩大和产量的进一步提高。因此,利用分子育种手段培育兼具抗旱、耐盐和抗虫性
学位
近年来,信息产业发展迅速,计算机硬件不断升级,分布式集群对于海量数据的存储和计算能力不断提升。在此基础上,近年来工业界诞生了一系列针对海量数据而设计的分布式框架,比如MapReduce,Spark,HDFS等等,Spark又因为其内存计算的特点博得了众人的青睐。但是在实际使用中,Spark超过200项的配置参数往往使人困惑,参数的不合理配置会导致作业运行缓慢和集群资源浪费。在此基础上,本文提出了S
对于高维的金融数据,经典的多元正态分布不能很好地刻画其相关结构。尤其是当极端事件发生时,世界各国的股指会极其显著地同步变化。为了灵活地刻画变量之间的相关性,Copula