【摘 要】
:
在图像处理与计算机视觉迅猛发展的过程中,大规模数据及标签的监督学习是人工智能的关键因素,然而,在实际场景中,有些类别难以获取足够多的数据、标签注释需要花费极高的人力物力,以及传统的监督学习无法识别未见过的类别,这些问题使得零样本学习成为目前更现实且急切的需求。针对上述困难,本文主要研究中小规模数据下的零样本及广义零样本图像分类与视频动作识别问题。零样本学习赋予了模型像人类一样学习的能力,通过将可见
论文部分内容阅读
在图像处理与计算机视觉迅猛发展的过程中,大规模数据及标签的监督学习是人工智能的关键因素,然而,在实际场景中,有些类别难以获取足够多的数据、标签注释需要花费极高的人力物力,以及传统的监督学习无法识别未见过的类别,这些问题使得零样本学习成为目前更现实且急切的需求。针对上述困难,本文主要研究中小规模数据下的零样本及广义零样本图像分类与视频动作识别问题。零样本学习赋予了模型像人类一样学习的能力,通过将可见类中的知识迁移至不可见类,可以对训练中从未见过的图像或视频以正确分类。因此,当面对新类别时,不用重新训练,只需要融合之前学到的知识,就可以拥有识别从未见过的新类别的能力。然而,现有的方法仍然存在许多需要解决的问题。首先,针对不可见类数据缺失与映射域漂移问题,本文提出了一种基于变分自编码器的模态匹配零样本学习方法MA-VAE。该方法利用变分自编码器充分挖掘视觉和语义之间的关系,在将图像特征和语义特征投影到公共隐空间,并引入JS散度以对齐视觉特征与语义特征的分布,实现了模态对齐与高质量的不可见类样本的合成。该算法不仅仅提供了强大的理论支撑,同时实验证明了良好的泛化性能,在多个数据集上都取得了比较理想的结果。其次,针对生成特征判别性不高的问题,在模态对齐MA-VAE模型的前提下,本文提出了MASL-VAE以实现生成特征同类相互聚集,异类相互分散的目标。该方法改进了传统自编码器隐特征区分性不高的缺点,并且在训练中不需要用到标签信息,仅仅通过正负样本隐特征之间的距离构建的Softmax损失函数就能生成不可见类的合成特征,从而大幅度减少了分类器识别的难度。为了验证本文算法的有效性,本文在图像数据集CUB、SUN、AWA1、AWA2与视频数据集UCF101、HMDB51上进行了零样本与广义零样本实验,并与目前主流的零样本学习算法进行了比较。通过实验结果的分析探究与可视化,证明了本文所提出的MASL-VAE相比于其他生成模型能有效提升分类效果。
其他文献
随着无线通信技术的迅猛发展,低截获通信被广泛应用于军事通信、保密通信及安全通信领域。对于传统通信而言,信号具有循环平稳性和各态历经性,截获方通过一些信号检测手段很容易获得其通信参数。为了打破传统通信信号的固有参数特征,本文从物理层安全出发设计出一种具有非平稳性的低截获传输波形。低截获传输波形的构造原理是将符号域、时间域、频率域三个维度引入时变的通信参数,来打破固定参数引起的循环平稳特性。换句话说,
为了应对日益增长的信息安全威胁,人们对通信网络的安全要求越来越高,其中光接入网安全性对通信网络的安全尤为重要。光接入网在下行信道中的广播通信存在被窃听的风险,因此开展光接入网安全研究尤为关键。现有的光接入网安全方案中,上层加密、光编解码和混沌激光通信等方案还存在不能全数据加密,密钥空间有限,信号同步稳定性较差等不足。而光物理层混沌加密技术则在上述方面表现出了较大优势。正交频分复用无源光网络(Ort
表面湿粘附研究是力学、材料和生物多学科交叉领域的研究热点,具有重要的实际应用价值。本文首先研究了三相接触线对表面迟滞的影响,并用软件Surface Evolver对模型进行了模拟比较,结果与模型符合。同时我们还制备了一系列相同面积比的微米表面,并对表面的迟滞行为进行了实验测试,测试结果证明了三相线模型的正确性。在湿粘附部分,本文建立了一个二维模型研究壁虎脚趾多绒毛结构增强湿粘附的机理。利用二维模型
随着第五代移动通信技术的发展,大量移动终端接入网络,导致对数据业务的需求急剧增加,如何快速有效获取内容是用户非常关心问题。为了满足用户对移动数据爆炸性的需求,同时最大程度地降低能源消耗,通信系统需要在能耗、吞吐量和用户的延迟方面来提高网络性能,因此为了更好地利用网络资源,D2D通信和缓存是支持无线网络上大量内容传输有前途的方法。此外电池供电的移动设备之间频繁发送数据会很快耗尽其能量,而能量收集是为
近年来,患上心理疾病的人数越来越多,心理问题呈现复杂多样的特点,并且平均年龄有逐渐减小的趋势。因此小学的心理健康教育对社会的心理健康发展有着举足轻重的作用,这提示我们应该从小培养儿童良好的心理健康素质。但是,当前小学的心理健康教育受限于各种社会因素存在普遍的问题。本论文将从不同类群小学生心理问题差异及教育对策来进行论述。
本论文在考虑环境相干性影响的情况下,讨论了量子系统与环境之间的能量交换。在已有工作的启发下,本文以时间局域的(time-convolutionless, TCL)主方程为工具,研究在环境相干时间内,二能级系统和谐振子系统与环境间的热交换以及热平衡的形成过程。利用两种快速量子操控方法:量子芝诺效应和量子bang-bang操控,本文进一步研究了利用bang-bang操控控制谐振子热力学性质的方案。从实
量子计算机可以更有效的解决某些问题,比如:对无序数据库的搜索问题和大数质分解问题。尽管量子计算机有着强大的运算潜力,但建造量子计算机却是件非常艰巨的任务。在所有这些困难中,消相干问题和硬件设计问题可能是最难处理的。消相干是由于量子计算机与环境的相互作用或纠缠,导致系统从相干状态向非相干态演化的趋势,并可能最终导致储存在量子计算机里的信息的崩溃、量子计算失败。量子计算机硬件设计中存在问题是如何实现量
今天,全球会展业都面临着新技术的持续影响和新冠肺炎疫情的冲击,而中国会展业还处于百年未有之大变局中。加入WTO以来,中国的会展业和会展教育迎来了快速发展的黄金20年。随着国民经济发展和社会进步,一方面会展业已延伸到日常生活和文化领域中,近年来各城市的节庆、赛事、活动层出不穷,聚小成多,其总体规模和影响力不亚于一般的展览业和大型活动;另一方面会展与营销、旅游、文化、艺术、媒介已呈现深度融合的趋势,并
本文针对高轨卫星外辐射源雷达系统中微弱目标检测技术做了一定研究。该系统首先利用高轨卫星发射信号照射目标,然后利用地面的雷达接收目标回波,以达到探测目标的目的。然而由于高轨卫星与目标距离与目标离雷达的距离较远,使得雷达接收到的目标回波信噪比较低。为了使信噪比达到目标检测的要求通常需要对回波进行长时间积累处理,但是较长时间的相参积累会带来距离走动和多普勒走动的问题,针对此问题,对长时间积累算法进行了一
作为无线通信系统的关键增强技术之一,中继通信技术是扩大无线服务覆盖范围,提升边缘用户通信质量,促进通信网络负载均衡的有效手段。其中双向中继技术因为占据高频谱效率、低中继时延等优势,备受研究领域关注。此外,为避免发射信号对接收信号造成强干扰,双向中继系统的节点大多采用半双工工作模式,这会给无线中继系统带来部分资源损失,因此结合新的技术设计有效的方案以优化现有中继系统的性能,具有重大的理论价值与实践意