辅助数据下的少样本图像分类算法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:joshua5201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来少样本学习受到了很多关注,它旨在从少量有标签训练数据中实现快速学习和泛化。少样本图像分类作为少样本学习的主要分支,它的目标是在每个类只提供单个或几个训练样本(支持样本)时学习一个分类器以识别测试样本(查询样本)的类别。在少样本学习中应用元学习的思想可以帮助模型在相同类型任务之间迁移有用的元知识,一定程度上减轻样本量少带来的问题。但是少量样本带来的信息十分有限仍不足以充分表示一个类别。在元学习思想的基础上,有少样本图像分类方法利用了文本数据和无标签图像数据作为辅助数据提升分类性能。本文针对以上两种数据辅助下的少样本图像分类任务分别提出:对齐模态下的各向异性组合方法、异常点暴露下的自适应学习向量量化方法。论文的主要研究内容如下:1)最近,研究学者在少样本图像分类任务中引入了相应的类别标签文本嵌入。其中类别标签的嵌入由在大型语料库中训练后的词嵌入网络提取,不同类别文本嵌入之间的距离体现了不同类别之间的语义关系。因此,如何利用文本域内的结构信息使类原型更具可区分性成为一个要点。此外,由于查询数据都来自视觉空间,因此保持类原型在视觉域更有利于分类。基于元学习思想,本文提出对齐模态下的各向异性组合方法。通过各向异性组合文本域和视觉域的信息优化类原型,同时添加文本对齐和视觉对齐,使得最终学到的类原型在利用文本域结构信息的同时仍保持在视觉域,以实现对查询图像数据更好的分类。在episodic训练机制下,本文为每一个少样本图像分类任务引入类别标签文本的嵌入向量,在这些任务上学习如何利用词嵌入向量优化类原型的元知识。实验表明,相比其它利用文本数据的方法,本文通过添加合适的文本对齐和视觉对齐约束,可达到更高的分类准确率(65.21%→66.60%)。在1-shot且支持样本不清晰(背景复杂或含有多个对象)的少样本图像分类任务上,实现了更好的效果。2)在少样本图像分类任务中引入的无标签图像数据可分为两种情况,一种是所有的数据都来自于与支持集相同的类别集,另一种是更具挑战性的情况,存在一部分无标签图像数据来自于干扰类别(与支持集不同的类别)。而人们不仅可以从一般的无标签数据中获取信息,也可以从完全来自干扰类别的无标签数据(无标签异常数据)中获取信息以更好地学习一个新的概念。在这一现象的启发下,本文将在纯粹的无标签异常图像数据的辅助下提升少样本图像分类性能。基于元学习思想,本文提出异常点暴露下的自适应学习向量量化方法。通过自适应的学习向量量化方法利用无标签异常图像优化类原型;同时添加异常点暴露约束,利用无标签异常数据的分布信息,进一步优化特征嵌入网络。在episodic训练机制下,本文为每一个少样本图像分类任务引入无标签异常图像数据辅助,在这些任务上学习如何利用无标签异常数据优化类原型的元知识。实验表明,在只提供少量无标签异常数据的情况下,少样本图像分类的准确率即可得到提升(52.08%→53.36%)。
其他文献
信用预测是对用户数据进行建模,预测其信用等级或评分。机器学习的方便快捷,在节省人力物力的同时,为信用预测提供了有效的解决方案。由于实际生产生活中存在大量的无标记信用数据,采用半监督方法能够更加合理的利用这些数据,同时半监督深度学习因其强大的学习能力和批处理数据的能力,使其更适应于大规模的信用预测场景。本文以两个较大规模的公开信用数据集作为分析和研究对象,研究了目前较为流行的半监督深度学习方法在信用
学位
2020年新冠肺炎(Corona Virus Disease 2019,COVID-19)给全世界经济生活带来了深刻的影响,当前存在大量非结构化COVID-19文献文本资源,利用实体关系抽取技术构建COVID-19知识图谱,对强化COVID-19的认知至关重要。由于目前缺少COVID-19领域标注语料,难以利用现有技术获取文本中的相关知识。当前大多数实体关系抽取技术主要基于循环神经网络来对单句文本
学位
随着科技的发展和网络医疗咨询的逐步兴起,越来越多的用户通过在线服务平台进行医疗咨询和寻求帮助。目前这些平台在回答用户问题时,一般通过搜索引擎进行问题检索,这种方式主要依赖于关键词语信息匹配,同时受用户对医学专业词汇表述的影响,通常不能充分理解用户语义,难以获取准确的内容。为了解决传统在线医疗服务平台存在的这些问题,医疗问答系统通过医疗知识库来匹配用户描述的病情,直接给出相关解决方案。但由于目前医疗
学位
各种社交媒体、电子商务平台等互联网应用的普及给人们的生活带来巨大便利的同时,也方便了人们对某些事物发表自己的主观看法,这些带有丰富个人情感和主观倾向性的内容蕴含着巨大的商业价值和社会价值,因此情感分析一直都是研究者们重点关注的热点问题之一。以往的研究工作主要针对句子级和篇章级情感分析任务,此类研究的目的是判断一个句子或一篇文档的情感倾向性。而方面级情感分析任务的目的是分析文本中不同方面的情感倾向性
学位
传统的可重构架构,例如现场可编程门阵列(FPGA)面临存储资源稀缺和路由开销较大等问题,难以满足未来数据密集型应用的需求。忆阻器能够在器件级实现存储计算一体化,基于忆阻器实现的存算互换架构有望解决上述问题。存算互换架构基于忆阻器交叉阵列结构实现,可将逻辑、互连和内存无缝地合并在一起,从而提供了更大的硬件资源灵活性,可以灵活地处理数据密集型或计算密集型应用程序,目前已得到了广泛的关注。虽然新型存算互
学位
《〈论语〉十二章》体现了孔子的学习观和修身思想。本文以义务教育阶段语文核心素养为依据,借助群文阅读的理念,对该篇课文进行教学设计,共分为五个部分。第一部分阐释本次群文阅读的价值与可行性,第二部分是议题的确立,第三部分是教学内容的选择,第四部分是教学设计,第五部分是教学思考,希望给一线教学提供帮助。
期刊
随着信息技术革命的日益推进,数字化转型成为中小物流公司在未来生存发展的必然需要。本研究集中探讨了数字鸿沟情景下中小企业数字化转型的“不敢、不会、不能转”的数字鸿沟问题,从数字鸿沟视角为中小企业数字化转型提供了实现路径,有助于中小企业更加深刻地剖析自身存在的问题。
期刊
本文以2012—2020年中国A股上市企业为研究样本,实证分析不同生命周期阶段的数字化转型对企业价值的影响。研究结果表明:(1)随着生命周期的推移,数字化转型与企业价值之间呈现先上升后下降的倒U型关系,且数字化转型不能显著提高衰退期企业价值;(2)数字化转型通过技术创新和业务创新影响成熟期企业价值,且数字化转型仅通过技术创新影响成长期企业价值;(3)数字化转型对国有企业和高市场化地区企业价值提升的
期刊
随着计算机的飞速进步和互联网的迅速扩张,人工智能、大数据和5G技术在2015年到2020年期间取得了巨大的进展。伴随着这些高科技的发展,用户在各种计算机终端设备上,访问的信息形式发生了由文字到音频、音频到图像、图像到视频的巨大转变。在图像的采集和传输过程中很容易会受到多种不同原因的影响而使得图像的质量变差的情况。为了缓解这些因素对图像的影响,更加先进的图像去噪技术迫切需要被提出。本文以图像去噪为基
学位
随着近年来生物测序技术的迅速发展,基因数据井喷式增长,测序在生物信息学研究中扮演了重要的角色。在育种实践中,由于样本规模较大,高密度的测序数据获取成本较高,通常会采用高低密度测序混合的方式来获取基因型数据,分析计算时再利用基因型填充工具将低密度数据填充为高密度数据以获得更准确的选种选配结果。基因型填充主要是利用缺失位点与附近位点的遗传连锁不平衡特性来推断缺失值。传统填充方法大多是基于隐马尔可夫模型
学位