基于自编码器和关系度量的零样本图像分类研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jsyzcqg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
零样本图像分类是一种借助图像的视觉特征以及语义特征,从已见类别中学习得到分类信息,并在未见类别中完成分类目的图像分类方法,它对于图像分类有着极其重要的作用。目前的机器学习算法虽然可以达到对图像分类的目的,但这依赖于大量标注的训练样本。然而,当今大数据时代信息繁杂以及存在某些特殊样本采集困难的问题,此现状给模型训练带来了瓶颈,由此催生零样本图像分类学习,它能够有效地解决对未知类样本进行分类的问题。现阶段,寻找视觉空间和语义空间嵌入关系以进行知识迁移是零样本图像分类的主流。然而,由于已见类样本和未见类样本数据结构不一致导致的领域漂移问题严重影响算法的分类性能。另一方面,训练时源类样本倾向于被投影到源类语义特征锚点附近,导致测试时测试样本易倾向于被分到源类中,产生强偏置问题。针对上述问题,本文从不同方向对算法进行了改进,内容如下:1、针对源域和目标域样本特征结构不一致而导致的领域漂移问题,本文提出了基于双重自编码器的零样本图像分类模型(Double Autoencoder,DAE)。DAE算法结合了语义自编码器模型,在视觉特征和语义特征中引入公共空间,利用双自编码器使语义特征指导视觉特征去冗余、视觉特征引导语义特征填补缺失语义。DAE有效保留了更多视觉特征和语义特征在互相嵌入过程中具有判别性的特征,提升了模型的迁移能力从而有效解决领域漂移问题。在5个常用数据集上定性及定量的实验结果表明,DAE具有较好的性能。2、针对测试样本在嵌入空间中靠近源域样本特征锚点产生的强偏置问题,本文提出了基于关系度量的零样本图像分类(Relation Measurement for Zero-Shot Learn-ing,RMZSL)。RMZSL 直接从语义差异关系角 度入手,不仅使用了 原始的语义信息,同时使用了不同类别语义之间的差异信息作为辅助表示;同时,在嵌入空间中设计语义中心正则项使得嵌入特征很好地分开;最后,结合关系度网络学习训练了一个更利于分类的神经网络。RMZSL充分利用了语义之间的差异信息,使得嵌入特征在子空间中更能描述样本的原始特征结构,有效缓解了强偏置问题。在常用的5个数据集上定性以及定量的实验表明,对于广义零样本学习任务而言RMZSL能够有效地缓解强偏置问题。
其他文献
逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)是不同于传统雷达的一种具备高分辨成像能力的雷达。ISAR通常是静止的雷达对运动的目标进行纵向和横向二维高分辨力成像,因此能够获得卫星、空间站等空间目标的尺寸、形状、结构等重要信息。在国防安全、战争情报获取、目标打击等方面发挥着重要的作用。随着军事技术的发展,对ISAR成像的特征提取与质量评估研究具有重要的军
随着环境形势的严峻,越来越多的国家将汽车研究重心放在纯电动汽车上,纯电动汽车在行驶过程中既带来方便也存在着安全隐患,为了保证纯电动汽车在行驶过程中的安全,对纯电动汽
在缺陷修复过程中,开发人员通常会分析软件缺陷存储库中的历史相关缺陷报告,以支持各种缺陷分析和修复活动,例如,缺陷理解、缺陷定位、缺陷修复等。缺陷文本中包含丰富的语义和关系,有效地搜索这些缺陷知识对于缺陷的理解非常重要。但是,由于缺陷数据的复杂性,传统的关键词搜索方式并不适用于这一领域。另一方面,目前的抽取技术主要针对已经定义好实体和关系类型的传统领域文本,如新闻网页、电子邮件和专利等。然而,缺陷数
出芽短梗霉(Aureobasidium pullulans)作为丝状真菌,有酵母状、膨大状和厚垣孢子等生长阶段,具备产生重要有机物普鲁兰糖的能力。本研究通过对出芽短梗霉NG发酵液检测,发现其不仅可以产生一种具有漆酶活性的小分子物质(AP因子),而且产生了乳酸。漆酶(Laccase)是一种含铜的多酚氧化酶,它所包含的铜离子拥有特殊的氧化还原能力,能够催化和氧化各类芳香族底物。乳酸作为一种在世界范围内
生活水平的提高,改变了人们的消费观念,最常见的消费也已变成外出旅游,此种改变也带动旅游产业蓬勃发展起来,并逐渐成为我国最有发展前途的产业之一,对我国的经济发展有着不可忽略的推动作用,并占据着重要地位。依据相关部门的数据调查可以得知,2018年,我国国内旅游业市场依旧保持着持续增长的良好趋势,2018年国内旅游总人数达到55.39人次,同比增加了 10.8个百分点,旅游业发展所带来的收入在2018年
人脸识别是模式识别领域中的重要研究内容,近几十年一直受到学者们的广泛关注。其中基于线性回归的分类算法由于其思想直观且意义明确,成为人脸识别算法中的一个研究热点。基于线性回归的分类算法通过对重构系数和重构误差的不同约束以应对不同情境下的识别问题,因此具有较高的灵活性和鲁棒性。然而,现有的基于线性回归的分类算法没有考虑样本图像中的几何结构关系,导致在含有大比例遮挡或者训练集被污染时,其分类性能将会下降
二十一世纪是信息时代和网络时代,信息时代和网络时代下诞生了“微课”。微课应用于教育教学中,与传统的课堂教学相比,有着非常突出的特点,它可以课前使用、课中使用、课后使用,具有非常强的灵活性,知识传授的针对性也非常强。在教学活动中,使用微课教学策略,更容易贴近学生的差异化需求,更容易提高学生的学习积极性,适合学生自主学习,也适合学生小组之间的合作学习,这样更容易激发学生的学习兴趣。在传统的中职《烹饪营
随着社会的迅速发展,在电力行业中输电线路安全稳定运行的要求逐渐提升,对于安全性能的智能监测已经是目前最棘手的问题,在精密自动化仪器和智能设备行业中,高精度、高可靠的传感器在如今生产和科研环境中的需求日益增加。由于目前检测技术,多为抗电磁干扰弱、灵敏度低差、成本高等缺点。因此抗电磁干扰能力强、高精度的此类新型传感器具有很大的应用价值以及研究意义。基于光纤传感技术的发展和优势,本文主要针对光纤式位移及
随着中国资本市场的不断完善,作为中国上市公司再融资重要手段之一的可转债,至今也得到了长足的发展。2017年,证监会出台54号再融资新政,直接提出鼓励有融资需求的企业发行可转债,同年9月8日,上交所发布可转债新的规定,允许投资者采用信用方式申购可转债。这些举措为可转债的发行和销售提供了有力的支撑和保障,使得可转债市场得以持续稳步前进。然而,在可转债市场蓬勃发展之际,本文观察到随着可转债公告的发布,上
影响力的传播研究是复杂网络分析领域中的重要组成部分,复杂网络上的传播学问题研究事物在实际的系统中的传播行为,而影响力最大化问题和负影响力抑制最大化等问题一直以来都是备受关注的热点问题。随着各种各样社交网络平台的出现和流行,其各类平台上产生了大量的行为数据,为社交网络的研究提供了良好的环境。影响力最大化起源于病毒营销,而随着营销方式和手段的改变,社交网络又逐渐为营销搭建了良好的平台。因此,研究影响力