基于语义知识的零样本图像分类方法研究

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:chongai2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着深度学习技术的发展,基于有监督学习的方法出现了巨大的性能提升,尤其是在图像识别方向,其准确率已经超过了人类的识别能力。为了获得这种卓越的分类精度,需要为数据集中每个目标类别提供大量有标签的训练样本。然而,由于有监督方法学习得到的分类器无法很好地迁移到其它类别地图像集中,因此,每遇到一种新的场景便需要重新制作需要消耗大量人工的有标签数据集,这种对有标签数据集的需求极大阻碍了有监督学习的发展。如何使模型能适用在新环境中以减少图像数据集制作中的人工消耗成为了亟待解决的问题。零样本学习出现的目的,便是在于解决这种缺少有标签数据的学习任务。尽管目前基于零样本图像分类的方法已取得了不错的进展,但仍然存在许多需要改进的地方。例如,模型无法有效利用外界丰富的先验知识、语义空间与视觉空间不匹配导致语义间隔等问题。因此,为解决这些存在于零样本图像分类任务中的问题,本论文将从网络模型和类别表征定义两方面提出改进方法,主要包含以下工作:(1)论文提出一个新的基于视觉属性和图注意力机制的关系增强型图卷积网络模型,通过引入基于图的注意力机制和关系增强型知识图谱加强类别间关系以更好地实现语义知识在类别间的迁移。(2)针对零样本学习中存在的语义间隔问题,提出了一种基于语义信息融合的算法,将词嵌入向量与视觉特征描述有效结合起来以减小语义间隔带来的影响。将论文中提出的方法应用于常用的图像分类数据集,并进行相关实验验证了所提出模型的有效性。
其他文献
内蒙古锡林郭勒盟地区是以汉族和蒙古族为主的民族文化丰富的地区,其中“那达慕”大会是蒙古族独具特色的传统活动,这一点集中体现出民族传统体育活动是推广蒙古族文化和体育文化的主要方式,对提高民族传统体育项目的水平和促进民族文化的交流有着重要的意义,因此如何有效地传承和发展民族传统体育成为了人们普遍关注的问题。本研究以锡林郭勒盟5所蒙古族小学的学生与老师作为调查对象,运用文献资料法、问卷调查法、数理统计法
体育教师的课堂教学行为是体育教师在课堂教学活动中所表现出来的以传授体育知识与运动技能,传播体育文化为主要目的的举止行为。它是体育教学系统中最具能动性的组成部分,在体育课堂教学中发挥着主导性作用。体育教师的课堂教学行为不但是体育教师专业素养和职业能力的外在表现,更是体育课堂教学的灵魂所在,对体育课堂教学质量产生着决定性的影响。在体育教学的相关研究中,体育教师的课堂教学行为最具研究价值。本文通过文献资
将搁置的老龄VLCC(Very Large Crude Carrier,VLCC)用作海上储油,是近年来储油企业形成的一种新态势。尽管老龄VLCC用于海上储油,具有某些方面的优势,但由于老龄VLCC海上储油所处的自然环境、工作环境和工作过程的特殊性,加上原油所具有的特殊物理、化学性质(如易燃、易爆及腐蚀等),使得老龄VLCC海上储油过程中存在着极大的安全隐患,老龄VLCC海上储油安全的最大威胁是原
近年来,随着国家的房地产调控政策的实施,房价较为稳定。但不同地区房价差异巨大,这也是导致不同区域企业创新能力差异的原因之一。企业创新能力关系到其生存和发展,只有提高创新能力才能在激烈的市场竞争中生存下去。根据内生经济增长理论,一个区域经济的增长需要大量的知识和技术的积累,而企业创新则能够从根本上满足这种需求。由于过热的房地产投资带来的资源分配不均会成为企业创新的重要外部制约因素,从而会使企业对创新
能源互联网是一个包含多个微电网、各类型独立发电单元和各种独立用户的负载信息物理系统,是解决当前能源危机与环境危机的重要手段之一,是实现第三次工业革命的技术支柱。本