【摘 要】
:
近年来,由于深度学习的应用越来越普及,我们擅长的通过大量标签数据来训练网络模型的方法越来越成熟。无论在图像识别、语音识别、还是在自然语言处理方面,都取得了很大的应
论文部分内容阅读
近年来,由于深度学习的应用越来越普及,我们擅长的通过大量标签数据来训练网络模型的方法越来越成熟。无论在图像识别、语音识别、还是在自然语言处理方面,都取得了很大的应用成功。但随着互联网的极速发展,多样化数据的膨胀,我们的网络模型也遇到了新的瓶颈。传统的机器学习模型对样本和应用两类数据集的特征分布要求满足独立同分布,且训练后的模型对新环境缺乏泛化能力,然而现实世界的物质形态是多样化的。那么,我们需要考虑如何将原有的知识模型迁移到新的领域中,以适应新环境的应用,而不是每当进入新的领域时,又从零开始学习知识。我们把这种迁移过程称为迁移学习。因此,针对迁移学习理论具有重要的研究价值,它能帮助我们的模型迅速地适应新领域,以应对瞬息万变的信息时代。本文首先从浅层网络模型的迁移过程入手,以简单、直观易懂的方式表述迁移学习的具体流程,并作为对比实验之一,与后续深度模型的迁移学习实验形成对比。然后分别从特征相似性和其概率分布相似性的层面上,提出几种度量相似性的方法,应用于深度模型的迁移学习过程当中。本文主要工作点如下:1、引入一种潜在相似性特征的筛选法。首先由已知领域的数据集对卷积模型及分类模型进行分类训练。然后由该模型的卷积部分对未知领域的数据集进行筛选,因每个卷积核等同于一个特定的特征过滤器,根据两类领域数据集通过的过滤器的输出值大小的对比,则能得到每个卷积后特征的相似度。进而可得到两类领域数据集在特征方面的相似度,从而完成模型的迁移。2、使用特征的整体概率分布相似性来评判相似特征的方法。先由已知和未知两类领域数据集分别经过已训练好的卷积模型得到输出数据集,再对输出数据划分区间范围处理,并建立特征的离散分布律。然后再使用KL散度检验法,其检验法从某一特征的全局概率分布出发,而忽略局部、个别分布差异的情况,计算其在两类领域数据集中的整体分布差异,这样可得到特征的整体概率分布相似性量化值。3、提出一种相似性动态量化的迁移学习算法,该算法也是基于特征的边缘概率分布相似性。与上述第2要点不同的是:本方法将从局部、细化到每个取值区间的概率分布来计算相似性。这样特征的分布相似性将是动态化的,是随着卷积部分模型的输出特征值而定,从而实现动态化微调训练参数。然后再建立一种联合评判相似性的函数,函数由特征相似度和分布相似度两个自变量组成,并对自变量设置可调权重。由评判函数综合评估每个特征的相似性,并在迁移网络模型训练中,针对相似性特征所连接的权值参数的调整幅度由其相似性的程度而定,而不是统一的调整幅度。
其他文献
雅克马利坦说“人在精神上的创造性是艺术活动本体论的根基”[1]。不管是创作者还是观者对于想象力的发挥是尤为重要的。每一位创作者的作品都是由感性情感构建而成,作品被创造后依然是人对于审美意象投射的一种载体。但是因为艺术的不可复制性,创作者在创造时时常遇到瓶颈,缺少更多的设计思维去给予观者新鲜感。而对于观者而言,处于信息爆炸的时代,很难从这种复制麻木的信息中寻找到真正深入人心的作品,看到作品也无法获得
移动终端非常普遍的应用于我们的日常生活中,极大的满足了人们的需求,但是在畅享这种极大便利的同时,我们对它的依赖程度越来越深,它也正在潜移默化的影响着我们的生活活动形
随着网络信息技术的快速发展,如何保护用户信息安全,成为了一个热点话题,用户身份安全认证技术应用越来越广泛,并且被广泛应用到各行各业。身份认证系统是一个用来保护用户信息安全的综合系统,目前身份认证系统中有三类认证方式,有关于信任物体的认证、关于生物特征识别的认证、关于信息秘密的认证。其中基于生物特征的身份认证技术越来越受到广大科研学者的重视,在众多生物特征中,虹膜识别身份认证技术由于虹膜自身的唯一性
最大频繁项集挖掘是数据挖掘重要研究方向,它以频繁项集簇的最简集合形式反映事务数据集项间的关联关系,具有重要的理论研究价值与应用前景。然而,大多数现有最大频繁项集挖掘算法更适于稠密数据集。但实际应用中,存在着大量的事务模式差异度大、项分布零散的稀疏数据集,设计适于稀疏数据集的最大频繁项集挖掘算法具有重要意义。本文从数据存储结构、算法搜索方式和优化剪枝策略等层面对经典的最大频繁项集挖掘算法进行了讨论与
云在热带天气和气候中起着重要作用,对热带辐射平衡和大气水循环有重要影响。云的分布对其他热带变量也有影响,云与热带海表温度(或海表面温度的梯度)、相对湿度、温度等变量
“财宝神”是流传在河州北乡地区汉族和土族群众中的一种走唱类说唱音乐,属甘肃省非物质文化遗产,具有浓郁的民俗文化风情。在当地人们心中,“财宝神”是荣登大雅之堂的“阳春白雪”,其高亢激越的唱词,有诗般的韵味,又具方言化特征,既接地气,又不失高雅,备受当地群众的喜爱。“财宝神”的表演,突出的是“送财宝”“贺太平”这一主题,以群众喜闻乐见的形式,装扮形象的角色,通过歌声来表达对幸福生活的憧憬和向往。“财宝
人的情感是人类特有的一种神秘且复杂的内在特征,也一直被认为是人与人工智能最本质的区别之一。人脸表情作为人类情感的重要元素之一,通过对它的自动识别的研究有助于弥补人工智能在理解人类情感方面的不足。近几年来对人脸表情识别的研究,受到越来越多的关注。表情识别的难点在于不同个体的脸部特征之间存在着差异,每个人对表情的表现方式也不尽相同,并且一种表情中可能同时糅合了多种情绪的表达,有时连人类也难以完全正确理
对话系统是自然语言处理的研究热点之一,其研究任务包括对话生成、对话匹配、对话状态跟踪和对话动作识别等。目前有关研究集中在各个任务的模型性能提升上,然而不同的任务使用的基础编码器仍然以循环神经网络(Recurrent Neural Network,RNN)或卷积神经网络(Convolutional Neural Networks,CNN)为主。近期出现的Transformer模型能够捕获句子内部词汇
随着大数据时代的到来,数据呈现数据规模大,数据模态形式多样等特点,对信息检索领域提出新的挑战。面对海量高维的多模态数据,如何快速准确对不同模态进行检索作为一个热点问题引起了很多研究者的关注。跨模态哈希(cross-modal hashing)方法通过构建模型将不同模态的异构数据映射成为同构的哈希码以解决不同模态之间相互检索的问题。该方法具有低存储开销和快速检索速度等特点,适用于大规模跨模态检索。大