基于神经网络的零样本图像识别算法研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:wuzheyun314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习和深度学习的飞速发展,图像识别技术已经在多个领域取得了令人瞩目的成就。这些技术训练模型时通常需要大量的有标签数据,以便提升模型的泛化性能,然而收集、标注大量的有标签数据是在现实世界中比较困难的。针对有些训练样本缺失的问题,零样本图像识别技术提供了解决方案。本文对基于神经网络的零样本图像识别算法进行了研究,具体研究成果如下:1.针对基于神经网络的零样本图像识别算法中存在的域偏移和枢纽点(Hubness)两个问题,提出了一种基于神经网络的双向映射模型。首先,对基于神经网络的正向映射模型和基于神经网络的反向映射模型用实验分析和比较,结果表明正向映射模型中存在着明显的域偏移问题和Hubness问题,而反向映射模型虽然在一定程度上避免加重了Hubness问题,但域偏移问题仍然存在。然后,本文对SAE(Semantic Autoencoder for Zero-Shot Learning)模型进行了研究,并借鉴其经典的解决域偏移问题的思路,在基于神经网络的反向映射模型基础上,提出了一种基于神经网络的双向映射模型。该模型在避免加重Hubness问题的同时,有效地解决了域偏移问题。大量实验表明,所提模型在Aw A(Animals with Attributes)上的图像识别率优于其他模型,在CUB(Caltech UCSD Birds-200-2011)上较优于其他模型。2.针对基于神经网络的双向映射模型中存在的Hubness问题,提出了一种基于关系度量的双向映射模型。本文采用关系度量网络代替传统距离度量,实现标签预测过程。这种方法不仅能够绕开最近邻算法中存在的Hubness问题,同时也能够将图像-语义跨模态学习过程和标签预测过程合二为一,从而实现端到端的训练,提高模型性能。大量实验表明,与其他模型相比,基于关系度量网络的双向映射模型很好地解决了Hubness问题,在CUB数据集上获得了非常高的图像识别率,在Aw A数据集上也获得了相当的图像识别效果。3.针对基于关系度量的双向映射模型中存在的训练样本不均衡问题,提出了一种基于中心变化约束和关系度量的双向映射模型。本文在基于关系度量的双向映射模型的基础上,通过增加中心变化约束,来约束映射后的图像特征向量都拉向一个固定半径的超球上,以此解决训练集类别不均衡导致的分类倾向问题,从而更好提高模型的图像识别性能和鲁棒性。大量实验表明,与其他模型相比,增加中心变化约束的模型在一定程度解决了训练样本不均衡问题,在Aw A数据集上模型性能和鲁棒性都有所提升,在CUB数据集上模型性能和鲁棒性相当。
其他文献
学位
随着数字信息技术的发展,数字信号处理已经在建筑工程、交通运输、医学、生态建设等诸多领域广泛运用。自适应滤波算法是数字信号处理的一个重要分支,它具有结构简单、适应性强、滤波性能优越等特点,被广泛应用于系统辨识、回声消除以及非线性处理等领域中。在这些领域自适应算法实现了突出的作用。然而,随着对自适应算法研究的越来越深入,面对亚高斯噪声环境,传统的自适应算法,传统的最小均方(LMS)算法,已经无法满足理
随着新能源发电技术的不断发展和完善,以及我国大容量、远距离的交直流混联电网的建设,未来将有大规模的分布式能源接入电网,分布式电源出力的时空不确定性将导致电网发生连锁故障的风险增加。根据分布式电源出力的时空随机特性建立分布式电源出力概率分布模型,有利于准确分析分布式电源出力波动对连锁故障的影响。分布式电源出力和负荷的随机波动导致电网潮流分布是一个动态过程,为提高连锁故障分析的可靠性,需要考虑电力系统
学位
中智集是用来处理生活中不确定信息的有效工具,在多属性决策,模式识别等方面应用广泛。中智集的度量也是中智集研究的一个重要课题,包括距离、熵、相似度等。学者们基于不同的应用环境,提出了多种形式的中智集以及相应的度量,并应用到决策问题中。本文为丰富中智集理论及扩大其应用范围,在已有中智集理论的基础上,做了如下工作:一、提出了多值直觉中智集的概念,定义了多值直觉中智集的基本运算,讨论了基本运算性质,并证明
为解决传统钢弹簧浮置板轨道固有频率处的振动放大现象,弥补其低频减振的不足,本文将磁流变阻尼隔振器引入钢弹簧浮置板轨道。通过UM-Simulink联合仿真模型与室内原比例浮置板轨道减振试验验证了磁流变阻尼隔振器在浮置板轨道系统中的减振效果;为进一步实现磁流变阻尼器在地铁实际运营中的应用,运用车辆轨道耦合动力学理论分析了不通运营条件下磁流变阻尼隔振器的最佳参数设计组合。本文的主要研究成果和结论如下:(
学位
现今城市轨道交通具有高速、高密度的特点,要求无线通信系统具备安全、高效、传输速率高等性能。在实际应用中,不可避免会出现列车控制系统因为网络质量差或者外界干扰导致列车紧急制动,造成列车延误的情况。因此识别网络故障原因,实现对网络状态质量的实时评估与对未来网络质量的预测能够在一定程度上提升通信系统性能,保障列控信息的安全传输。本文主要针对LTE-M车地无线通信系统网络状态质量评估与预测进行研究。首先介
目的:佛手是芸香科植物佛手Citrus medica L.var.sarcodactylis Swingle.的干燥果实,又称为“佛手柑”“五指橘”“蜜罗柑”等,在我国具有悠久的种植和药食两用历史,主要分布于四川、广东、浙江、福建等地。2020版《中国药典》中仅以单一成分橙皮苷作为佛手的质控指标,不仅缺乏特异性也无法全面评价佛手质量,活性研究也多集中在大类成分的作用,于具体有效成分少有涉及,药效物
超速行为作为典型的交通违法行为,严重影响着道路交通安全。其中,出租车作为城市道路交通参与者的重要组成部分,其超速行为亦较严重。由于出租车驾驶人对城市路网熟悉程度高,工作强度大,为了在有限的时间内完成更多的客户接单量以增加收益,该驾驶群体存在巨大的超速需求。然而,目前对出租车超速的处罚和干预主要从超速执法和出租车营运公司内部奖惩管理开展。前者将出租车视为社会车辆开展超速执法,但该方式难以掌握出租车行