多任务学习的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：renbinf4

【摘要】

：

在机器学习中,经常会遇到对几个相关联的任务建立机器学习模型的情况,比如关于人脸的识别、人脸表情的判断、人年龄的预测等。这些任务本质上都是对人脸数据进行建模,但是传

【作者】

：

李亚

【出处】

：

中国科学技术大学

【发表日期】

：

2018年期

【关键词】

：

机器学习多任务学习神经网络域自适应学习支持向量机核函数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在机器学习中,经常会遇到对几个相关联的任务建立机器学习模型的情况,比如关于人脸的识别、人脸表情的判断、人年龄的预测等。这些任务本质上都是对人脸数据进行建模,但是传统的机器学习往往通过单任务学习的方法进行训练,针对每个任务单独学习一个模型。这种单任务学习的方法忽略了多个任务之间的联系,损失了一些存在于数据或者模型参数之间的信息。特别是在单任务本身数据量不足的情况下,单任务学习很难通过训练得到足够的数据分布信息,因此学习效果会有不同程度的下降。多任务学习的提出就是为了解决单任务学习的这种弊端,通过进行合理的假设,充分挖掘任务之间的关系,从而为每一个任务提供额外的训练信息,最终提高每个任务的表现。本论文主要针对多任务学习的情况,对不同场景下的多任务学习方法进行研究,希望通过多任务学习的方法提高每个任务的学习效果。目前已有的多任务学习方法大致可以分为三类:基于特征分享的多任务学习方法、基于模型参数分享的多任务学习方法、基于深度学习的多任务学习方法。相比于单任务学习方法,这些多任务学习方法的效果已经在多个数据集上得到了验证。但是已有的方法也存在缺陷,主要包含以下几个方面(1)多任务学习需要同时使用多个任务的数据,效率上受到限制,求解复杂度高。(2)只考虑特征之间的关系或者模型之间的关系,没有将二者进行结合,从而导致任务之间的关系不够紧密。(3)线性多任务学习方法拓展到非线性核空间复杂度高,不易求解。(4)现有方法只考虑了当前任务的性能,学习到的模型很难迁移到将来某个相关的任务中。该论文针对现有方法存在的问题,分别设计新的多任务学习算法,从而改善现有方法的缺点。主要可以分为四个部分:基于近似支持向量机的多任务学习方法、基于特征分享与模型参数分享的多任务学习方法,基于特征函数的多任务学习方法以及多任务学习的拓展。其中基于近似支持向量机的多任务学习方法,旨在提高多任务学习的效率,降低多任务学习的复杂度。该方法能够对多任务学习目标函数进行显式的求解,求解过程中本文对矩阵的相关运算进行优化,减少了训练样本增多带来的训练效率下降的问题。最终该方法的运行时间在多个数据集上能有一个量级的提高,并且能够保证多任务学习的效果。针对多任务学习信息利用不完全的问题,本文提出基于特征分享与模型参数分享相结合的多任务学习方法。该方法同时衡量特征之间与模型参数之间的关系,避免了任务之间关系挖掘不充分的缺点,在多个数据集上的表现都比分别基于特征分享或者模型参数分享的多任务模型要好。在该方法中,本文提出并证明了将非凸目标函数转化为等价凸优化问题的可行性,并给出了最优解,降低了求解的复杂度。最后,本文给出了泛化误差的理论分析,从理论上证明了该方法的优越性。为了实现线性多任务学习模型能够简单的拓展到非线性核空间,该论文提出了基于特征函数的多任务学习方法,该方法实现简单并且有着良好的实验表现。基于特征函数的多任务学习思想也是本文提出的全新的研究多任务学习的思路,为后面多任务学习的研究提供了新方法。该方法也在实验和理论两方面上证明了其有效性。除了上述严格意义上的多任务学习方法,本文还研究了多任务学习的两个拓展问题。首先提出了基于神经网络将分类任务与特征学习任务相结合的学习方法,使得分类与特征学习之间互相促进。其次,为了解决多任务学习模型难以拓展到将来的相关任务上的问题,本文提出了基于域自适应的多任务学习方法,通过域自适应学习,能够学习到不同任务共有的特征,从而将模型很好的迁移到将来的某个关联任务上。本论文的贡献及创新点大致可以总结如下:·该论文针对现有方法的不同缺点提出了多个多任务学习算法,改善了现有方法效率低、任务之间关系衡量不充分、难以拓展到非线性核空间等问题。·该论文不仅在实验上证明了本文提出方法的有效性,并且给出了理论证明,对提出方法的有效性给出了合理的数学解释及分析。·该论文提出的基于特征函数的多任务学习方法从一个全新的角度去衡量任务之间的关系,为后面多任务学习的研究提供了新思路。·该论文对多任务学习进行了拓展,提出了将不同目标的任务联合学习以及如何对将来的任务进行高效的学习。

其他文献

以公众满意度为导向的政府精准扶贫绩效评价研究——基于山东省的调查问卷分析

立足于公众满意度导向,从理论基础、必要性以及实施困境三方面对政府精准扶贫绩效评价进行研究。在此基础上运用李克特量表法,对"山东省精准扶贫路径与业绩考核体系建设"调查

期刊

精准扶贫绩效评价公众满意度描述性分析

颜料型涂料固化过程中涂层多孔结构的研究进展

将涂料施涂于纸上，可以改善纸张的光学性能和印刷适性。涂料在纸上的作用效果可以通过一组形态特征，即通常所说的“涂层结构”进行评价。涂层结构的固化过程受多种因素影响，如涂

期刊

涂料组成固化过程中涂层多孔结构料型涂层结构印刷适性光学性能

基于正交试验法的隧道集中排烟部分影响因素模拟试验研究

基于正交试验法设计试验方案,采用FDS数值模拟方法,研究排烟量、排烟口间距、排烟口开启方式和纵向风速对隧道内火灾情况下集中排烟效果的影响,并利用方差分析得出各因素对隧

期刊

集中排烟正交试验法方差分析

我国农村金融供给侧改革的创新路径研究

为了推进我国农村金融供给侧改革,要在深入推进农业供给侧结构性改革的基础上,充分发挥好金融作为经济运行血脉的作用。本文首先分析农村金融供给侧改革的必要性,然后对其内

期刊

农村金融供给侧改革金融创新农业融资

蜜蜂蜇伤致过敏性休克死亡1例

1案例1.1简要案情某男,55岁。某日13：00许行走在马路上,不慎被蜜蜂蜇伤颜面部5处,即感剧痛,同行伙伴即将其蜇伤处蜜蜂尾刺拔除。10min后该男出现全身荨麻疹、呼吸困难、口吐白

期刊

法医病理学过敏反应蜜蜂

族群互动中的文化自觉——以广西客家族群关系为例

本文以广西客家族群关系为例,探讨族群关系在文化自觉的指令下,族群互动的方式、特征、规律及其作用。认为以文化自觉为指导的族群互动体现了国内族群关系的一般规律与特征;

期刊

文化自觉族群关系族群互动客家

福斯公司推出具有突破性的控制阀降噪新技术

全球流体运动与控制领域的顸尖产品及服务提供商美国福斯公司，宣布推出具有突破性的专利产品Flowserve Valtek Stealth——一种可在严酷工况条件下降低工业控制阀气体噪音的降

期刊

降噪技术控制阀突破性STEALTH专利产品服务提供商控制领域流体运动

韭菜锈病的防治

韭菜锈病主要侵染叶片和花梗，属真菌引起的病害，主要借助气流传播。发病初期在表皮上产生锤形或椭圆形隆起的橙黄色小疱斑，病斑周围常有黄色晕环，以后扩展为较大疱斑，其表皮破裂后

报纸

北美不含磨木浆未涂布纸纸机的关停将提高纸厂的开机率

RISI数据显示，若北美在接下来的6个月内关停100万t／a的不含磨木浆未涂布纸（UFS）产能，在2014年夏季来临之际，该地区UFS纸厂的开机率将达到96．5％～100％。到目前为止，2013年的UFS纸厂开机率

期刊

开机率涂布纸磨木浆纸厂北美纸机数据显示

AF＆PA公布第51届纸、纸板和纸浆生产能力调查报告

美国林业与纸业协会（AF＆PA）日前公布了第51届纸、纸板和纸浆生产能力年度报告。报告指出，2010年美国纸和纸板的生产能力下降了3．1％，达到9105万t；而2008年和2009年纸和纸板的生产能力

期刊

生产能力纸板调查报告纸浆年度报告美国纸厂纸机

多任务学习的研究

与本文相关的学术论文