基于生成对抗网络的零样本学习方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:BONNIE111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字采集设备以及社交媒体的普及,网络上存在海量的视频及图像数据。这些海量的数据通过人工收集和标记,可以帮助人们设计监督学习方法来完成不同的识别、分类等任务。然而,收集和标记大量数据是非常困难的,特别是对于细粒度对象和稀有对象而言,人工处理既耗时又昂贵。目前机器学习领域最热门的深度学习模型是由大规模数据驱动的,带标签的数据越多,模型的效果越好。当遇到任务复杂且标记数据少的情形时,模型将很难进行学习。因此,在训练样本不足、样本无标签甚至是零样本的情况下,如何训练模型完成识别和分类任务已成为机器学习和计算机视觉领域研究的新问题。为此,零样本学习成为当前的研究热点之一。其目的是识别所属类别从未在训练过程中出现过的新样本,基本思想来源于人类对物体的识别过程,即通过不同物体之间共享的高级语义属性作为辅助知识来快速识别新事物。目前,零样本学习在物种识别、智能体动作模仿、人脸检测和识别、图像场景分析等不同应用领域被广泛研究。目前多数的零样本学习方法研究属性和图像特征的空间映射关系,虽然模型在训练类别上面性能优越,但是在测试类别由于映射领域漂移和枢纽点问题使其模型性能下降。此外,目前基于映射的方法在更有挑战的广义零样本学习上表现不佳。针对上述问题,本文从零样本学习新方法展开,主要工作包括如下方面:(1)针对于映射领域漂移问题和枢纽点问题,提出了一种基于对抗思想的反向空间映射零样本学习算法。与现有在已知类上学习视觉特征到语义嵌入模型以桥接视觉空间和类别语义空间的方法不同,本文在语义重构和生成对抗框架中通过残差网络模块提出了一种新型反向映射方法(RRGAN)。具体引入反向空间映射、语义重构模块,和生成对抗机制。三者的组合同时解决了映射领域漂移问题和枢纽点问题,有效地提高了零样本学习的性能。(2)在RRGAN的基础上,引入集成学习思想,提出了基于多重网络合作的广义零样本学习方法(CCGN)。虽然RRGAN能有效提高零样本学习方法的性能,但是其在最新的、更有挑战的广义零样本学习上性能表现下降。为提高模型在广义零样本学习上的表现,本文提出一种基于多重网络合作的算法。具体利用不同生成网络对生成的视觉特征进行组合,最终合成更具判别性的视觉特征中心,有效提高了广义零样本学习的性能。(3)RRGAN和CCGAN主要还是基于映射的思想,本文利用目前最新的基于合成和生成的方法,提出了一种基于合成和生成思想融合的广义零样本学习方法(BFSG)。其目的是利用生成对抗网络的生成能力,通过语义属性生成视觉特征以及依赖于语义属性之间相关性,通过语义相关性合成视觉特征。最终,合成未知类类别的样本,零样本学习被转化成传统分类问题。该方法在零样本学习和广义零样本学习上性能表现优越。
其他文献
目的:采用改进的Hummers法制备氧化石墨烯,并通过两种不同方法制备氧化石墨烯接枝修饰的两种开管毛细管柱,增加了固定相的相比率,提高柱容量,进而提高对溶质的分离效率,并且扩展毛细管电泳的分析对象的范畴。同时也为开管柱的制备新技术,以及该类型柱在实际样品分析应用的可行性提供实验基础。方法:1)制备氧化石墨烯和制备开管柱的方法:(1)氧化石墨烯的制备:以石墨粉为原料,采用强氧化法制备氧化石墨烯。(2
经济学认为一个经济的结构是由其要素禀赋结构所内生决定的,而要素禀赋则决定一个经济的比较优势。政府根据比较优势原则所采取的发展战略是决定经济趋同是否会在这个地区发
自主式水下潜航器(Autonomous Underwater Vehicle,AUV)是一种无人操控、可自主导航的水下航行器,它集传感器技术、自动控制技术等高科技于一体,可用来组建水下数据采集系统
工程设计作为工程建设中的重要环节,为国民经济提供了重要的支撑,工程设计效率的高低,质量的优劣,直接决定工程的施工进度和难度,也决定了后续数十年的使用效果。工程设计是
随着通信技术的发展,频谱资源的短缺问题日益严重,可见光通信的发展越来越受到人们得重视,近年来,机器学习技术不断取得进步,使得将机器学习与可见光通信相结合成为可能。屏
由于能源问题和环境恶化问题日益严峻,需要我们做到可持续发展以及与自然友好相处。对废气废水,可再生能源等低品位热能的回收利用可以带来较高的经济效益和环保效益。超临界有机朗肯循环是目前回收低品位热能最为有效的途径之一,同时对蒸发换热器的研究和优化,能有效提高系统的效率。超临界流体在拟临界区域会发生剧烈的物性变化,使得对流换热特性较亚临界状态复杂得多。本论文以超临界CO_2为研究对象,采用数值模拟的方法
手语是听障人群的日常交流方式。手语识别将手语翻译成文本或语音进行输出,极大地促进了聋哑人群与其他人群之间的交流。同时,手语识别是人机交互系统发展的一个重要领域,在
伴随互联网的普及和信息技术的进步,网络游戏发展迅猛,影响力日益扩张,受到新闻媒体密切关注。结合新闻框架理论,本文运用内容分析、文本分析和案例分析法,梳理了2000年1月1
纳米孔单分子检测技术是一种操作简单、成本低廉、无需标记、灵敏度高、分析快速的单分子分析方法,目前已被广泛应用于蛋白质构象分析、酶动力学、金属离子等各种物质的单分子检测和分析中,并且该技术在快速基因测序技术上也显示出的巨大的应用潜力。其中,研究和应用最广泛的纳米孔检测器件主要为生物纳米孔和固态纳米孔。相对于生物纳米孔,固态纳米孔作为新兴的单分子检测器件,因具有稳定性好、孔径形貌可控化等优势成为热门的
团头鲂(Megalobrama amblycephala),作为我国重要的鲤形目、鲌亚科、鲂属中的重要的代表性的淡水养殖经济物种,由于食性广、养殖成本低廉,成活率高等优良品质而受到推广。201