基于生成对抗网络的零样本图像识别方法研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:michelle77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习在人工智能领域中的广泛应用,图像识别的精度得到较大提升。然而,基于深度学习的目标识别依赖于海量带标注的数据。但是,对现实世界中的海量数据进行标注成本昂贵,且有些罕见的数据获取困难。在此背景下,零样本识别的方法被提出,其关键思想是模拟人类的知识迁移能力,通过对可见类样本的学习,达到对不可见类样本进行识别的目的。其中可见类和不可见类分别表示带标签的类别和未带标签的类别。该方法广泛应用于计算机视觉的各个领域,如虚拟场景识别、交通场景识别和自然语言处理等。随着生成对抗网络(Generative Adversarial Network,GAN)的研究与发展,基于生成对抗网络的方法在零样本识别领域取得了较好的效果,但仍存在不足,如由于在知识迁移的过程中存在域偏移问题,导致对不可见类的识别往往会偏向于可见类;其次,由于通过生成对抗网络生成的特征存在大量冗余信息,导致不可见类的识别精度受到干扰。针对零样本图像识别过程中存在的问题,本文主要对如下两方面的工作展开研究。(1)提出了一种基于去冗余特征和语义关系正则化的零样本属性识别方法。模型对视觉特征进行了去冗余处理,在去除冗余视觉特征的同时保留了类别的相关性,由于在识别过程中减少了冗余信息的干扰,从而提高零样本识别的精度;利用可见类和不可见类之间的语义关系建立知识迁移模型,并引入语义正则化损失,使得生成器生成的视觉特征更能够反映可见类和不可见类之间语义关系,缓解了可见类与不可见类之间的域偏移问题;此外,在模型中引入了循环一致性结构,进一步使得生成的伪特征更接近于真实特征。在AWA、CUB、SUN和APY四个数据集上进行验证,并与现有较先进的零样本识别方法相比较,提出的方法对于零样本识别任务和广义零样本识别任务的精度分别得到提高。为了验证提出模型的泛化性能,将提出的方法应用到零样本图像检索和基于文本的零样本识别任务中,实验结果证明了提出的模型具有较好的泛化性能,且容易拓宽到其他应用中。(2)提出了一种结合迁移引导和双向循环结构的零样本文本识别方法。算法首先构造双向循环结构的GAN以提高模型的生成能力,从而使生成的伪特征更接近于输入的真实特征;其次,受人类知识迁移能力的启发,引入了迁移引导学习的思想,将可见类文本向不可见类文本进行迁移,并使用迁移后的文本代替可见类文本对模型进行训练,以提高不可见类文本的识别精度;此外,为了缓解训练过程中的模式崩溃问题,在模型中增加了一个有效的正则化项,使得生成器在训练过程中生成的结果更具有多样性,从而提高了生成模型的稳定性。最后在CUB和NAB两个数据集上进行实验,与现有较先进的零样本识别方法相比,提出的方法在零样本识别和广义零样本识别任务中的识别精度均得到提高。进一步,为了验证提出模型的泛化性能,将提出的方法应用到零样本图像检索和基于属性的零样本识别任务中,实验结果证明了提出的模型具有较好的泛化性能,较容易拓宽到其他应用中。
其他文献
随着信息化社会的发展,计算机技术已经成为现代社会必不可少的基础技术之一。而高职计算机专业的学生,将来要从事的也正是与计算机技术相关的工作。因此,在教学过程中,为了更好地满足社会的需求,应该注重学生的实践能力培养,让他们在学习的过程中,不仅了解理论知识,更要有一定的实践能力,这样才能更好地胜任工作。而本文将从高职计算机教学中学生实践能力的培养方面进行阐述。
期刊
社会的发展下,信息化成为当今时代发展的主流,涉及人们生活的各方面,教育教学中,国家更加重视信息化时代下的计算机教学。面对高职学子,计算机教学也是一项重要的内容,因为高职学生的特殊性,面对的是走向社会后的职业岗位,社会需求下的职业化也要求毕业生要具备一定的计算机知识实践技能。高职院校要从教材、教学方式、实践机会、计算机知识的运用等多方面着手,设计科学、合理的教学途径,切实提升高职学生的计算机水平。
期刊
目的 探究动机行为转化的护理模式对年龄> 60岁股骨粗隆间骨折(IFF)患者术后疼痛程度及生活质量的影响。方法 前瞻性选取南阳市第一人民医院收治的96例IFF患者(2018年1月至2020年10月),按随机数字表法分成观察组(n=48)、对照组(n=48)。对照组接受常规护理干预,观察组于对照组基础上予以动机行为转化的护理模式干预。比较两组治疗依从性情况、干预前、干预7 d视觉模拟评分法(VAS)
期刊
本文从阐释“读思达”教学法的内涵与要求入手,结合核心素养培育目标与记叙文文体特征进行教学目标设计,在此基础上围绕“定位文本核心要素、巧用问题引导方法、创设多元展示平台”三个层面,分别基于阅读、思考与写作维度探讨“读思达”教学法的具体应用实践策略,以期为初中语文记叙文教学提供参考价值。
期刊
压电陶瓷因具有优良的力电耦合特性、对外场激励响应迅速、不易受电磁干扰、易于微型化等优点,广泛应用于航空航天、车辆船舶、生物医疗等高精尖领域。由于压电陶瓷在工程中常服役于振动环境,因此振动产生的结构损伤和疲劳成为制约压电元器件性能的关键问题之一。本文旨在研究电激励和力激励条件下压电悬臂梁的振动与疲劳问题。主要工作如下:1)依据能量法和热力学平衡方程,推导出电压激励下压电悬臂梁的横向振动微分方程,通过
学位
滚动轴承作为机械设备中用于支撑转动和传递动力的关键部件,其运转状态良好与否,直接关系到设备整体能否稳定高效地运行。又因高速运转时受交变载荷作用、润滑不足、恶劣工况下异物侵入等诸多因素影响,使其成为最易发生故障和受损的部件之一,故本文决定将故障振动信号的时频分析、故障特征提取以及故障诊断作为主要研究方向。滚动轴承的振动信号蕴含丰富的故障信息,而以经验模态分解为核心的自适应时频分析法十分善于处理这类非
学位
小型无人机凭借其结构简单、造价低廉、控制方便等特点,近年来在民用领域中展现了巨大的应用潜力,如近地侦查、灾害预警、农业植保等行业。在水务领域中,小型无人机与地面站的联合可以有效完成飞行任务规划、飞行姿态控制、表计数据获取和分析等任务需求,大幅提升系统的自动化水平并降低抄表成本。本文围绕着四旋翼无人机在水务领域的具体应用展开,结合实际问题,对无人机航迹规划、状态显示、表计管理、人机交互等问题进行了初
学位
氧化沟污水处理技术是我国污水处理的主要手段,而曝气机是氧化沟工艺的关键设备,倒伞曝气机是目前使用最多的氧化沟曝气设备。目前氧化沟污水处理工艺还存在着充氧效率过低的问题。本文根据课题组前期研究成果,对一种新型曲面叶片曝气机影响下的氧化沟流场进行了仿真分析,同时对不同运行参数下的曝气机充氧性能进行了实验,并对叶片进行了结构上的优化设计,提高曝气机的充氧效率。本文通过对叶片进行CFD仿真分析与高速摄像观
学位
本文基于研究文献搜集和资料统计,总结出海洋地质-地球物理调查具有平台多样化、装备高精化、技术方法系列化、目标综合化的现状特点,并通过分析海洋地质-地球物理调查研究与地球系统科学之间的密切关联性,指出地球系统科学理念对海洋地质-地球物理调查研究范式、方向和内容、技术架构具有宏观全面的指导意义。未来的海洋地质-地球物理调查研究将在调查理念、装备技术、方法手段、合作研究、数据融合交换与共享5个方面有显著
期刊
数字化时代浪潮下,数据资产已经成为数字经济时代的重要生产要素。充分发挥数据要素的巨大价值,形成数据驱动的智能决策能力,是企业当前数字化转型的重要目标之一。因此,研究如何利用数据这一“隐形资产”,使数据资产化,丰富数据资产应用场景,建立数据资产生态,持续运营数据资产,具有重要的意义。本文从数据资产的相关概念出发,对数据资产的相关问题进行研究,以期为推动企业数据资产管理与应用提供参考。
期刊