【摘 要】
:
近年来,迁移学习在各个领域均取得了长足的发展和进步,基于深度学习的域自适应算法也日益受到人们的关注。迁移学习旨在将从一个任务中学习到的知识迁移到另一个相似的新任务中,有效地缓解了深度学习中的数据标注问题。目前,很多域自适应算法的优化目标着眼于在特征空间对齐源域和目标域的条件概率分布,因此,类别不平衡性对于此类迁移学习算法性能的影响十分明显。本文立足于类别不平衡性对于迁移学习的影响研究,主要工作如下
论文部分内容阅读
近年来,迁移学习在各个领域均取得了长足的发展和进步,基于深度学习的域自适应算法也日益受到人们的关注。迁移学习旨在将从一个任务中学习到的知识迁移到另一个相似的新任务中,有效地缓解了深度学习中的数据标注问题。目前,很多域自适应算法的优化目标着眼于在特征空间对齐源域和目标域的条件概率分布,因此,类别不平衡性对于此类迁移学习算法性能的影响十分明显。本文立足于类别不平衡性对于迁移学习的影响研究,主要工作如下:(1)针对源域中的类别分布影响,本文梳理了多种机器学习领域中常用的类别不平衡处理方法并将其应用于多种迁移学习算法,比较了多种不平衡处理方法对于迁移学习的优劣性。实验表明,过采样和加权随机采样更适用于迁移学习。(2)针对源域和目标域的类别分布差异对于迁移学习的影响,本文在目标域类别分布已知的条件下进行了理想性的验证实验。通过在训练前控制采样方式以获得各种不同分布的源域数据和目标域数据,并基于对称Kullback-Leibler散度对采样后的源域和目标域之间的类别分布差异进行了定量实验分析。实验表明,当源域和目标域之间的类别分布差异越小时,迁移学习算法的性能越好。(3)针对开放集迁移学习领域,本文提出了新的OSDA-EM算法和STA-EM算法。OSDAEM通过迫使训练网络Softmax输出的未知类别概率接近0.5来分离未知类别,实验表明OSDA-EM算法在开放集迁移学习领域相对于其它算法提升明显;STA-EM算法则在STA算法的基础上采用了Category-Diversity Loss,实验表明,在目标域采用Category-Diversity Loss能有效提升迁移学习算法的性能。
其他文献
大雾造成的低能见度往往严重影响车辆行人违纪识别、交通流检测等智能识别系统的运行效果。大雾情况下,空中漂浮的大量小水滴、小颗粒散射大气光照,阻碍了成像物体上反射光传播的路径,相机接收到的反射光大大减少,从而造成成像质量降低。因此,图像去雾的工作对保障智能识别系统的稳定、有效工作,具有重要的现实意义。本文改进了传统建模的雾霾图像合成方法,针对固定监控摄像头,提出一种基于暗通道的雾霾图像融合方法生成成对
法脿镇位于楚雄彝族自治州双柏县(以下均简称楚雄州),位置偏僻,山高林密,自然生态环境良好,是非物质文化遗产“老虎笙”的发源地。“老虎笙”是当地彝族支系罗罗人每年正月初八要跳的祭祀性舞蹈,是虎图腾崇拜的一种表现形式,也是古傩仪的珍存,具有极大的文化价值和经济价值。从2008年开始,法脿镇政府开始举办一年一届的法脿彝族老虎笙节,将其作为具有民族特色的节事旅游品牌推出。节事旅游是最近几年提出的概念,大众
随着医疗技术的发展,越来越多的患者选择植入金属义齿,以改善口腔中的牙齿问题,而关于这些患者的术后评估诊疗,一直以来都是临床诊断中的困扰和难点。当患者口腔中带有义齿、金属夹等异物时,他们的CT图像会因为这些高密度金属物的存在而产生明暗相间的条纹或散射状伪影,导致牙齿的组织结构边缘模糊难辨,给临床诊断带来极大的困难,严重情况下,甚至会造成疾病误诊,为患者的后续治疗造成不可估量的威胁。关于金属伪影校正的
随着互联网金融等行业的发展,个人生物特征被广泛应用于识别生物的个体身份。当前,使用较多的生物特征包括面部特征和指纹特征等。脑电信号也是一种独特的个人生物特征,由于其无法模仿和再现的优势,逐渐受到科研工作者的关注。然而当前基于脑电信号的个体身份识别仍有诸多关键问题有待解决,例如:可被用于身份识别的脑电信号的采集状态依然不明确;传统的脑电信号身份识别的数据特征是少数电极通道采集的单个波段脑电信号的频域
本文分为两部分,在第一部分中介绍了晶体材料的发展以及对晶体在高压下的相变研究,着重介绍了理论基础和计算方法,包括对2-甲基-2H-萘并[1,8-de]三嗪在0 GPa-250 GPa的压力范围内的结构、电子和吸收性质进行了详细的研究(下文简称2-methyl晶体)。众所周知,对于固体高能材料在高压下微观特性的研究一直是一项具有挑战性的任务,采用实验的方式研究材料需要相对苛刻的条件,因此使用计算机模
目前,建筑工地的视频监控分析系统依然以人工监察为主,然而监察员检查频率低,反馈时间长,工人安全意识相对薄弱,都导致建筑工地安全事故时有发生。因此,实现建筑工地安防视频分析系统的智能化和实时化势在必行,同时也是施工企业发展智能化安全管理的重要手段。针对这一课题,本文主要研究实时分析建筑工地作业人员是否佩戴安全防护用具(安全帽等)的智能算法设计,并从数据收集与制作、模型设计与训练和模型评估与优化三个方
随着无线通信网络的快速发展,移动用户对数据的需求也越来越高,这推动了蜂窝网络基础设施的建设和移动设备的爆炸式增长。但过于密集的基站部署会影响移动用户和设备之间的通信服务质量,对无线资源的消耗也成倍增加。因此,如何对无线资源的分配进行优化成为研究的关键。在通信领域中,资源分配的优化需要处理大量的基站数据。随着人工智能的日益兴盛,学者们将其与基站端的数据处理相结合,以此优化相关的处理过程与结果。作为人
随着中国社会的老龄化进程逐步深入,康复治疗的需求逐年递增,这也就促进了康复医疗行业的快速发展,康复机器人也开始崭露头角。传统的康复机器人都是根据特定的应用范围来开发的,只能针对患者有运动障碍的某一特定关节进行康复训练,不能满足不同患者的不同康复需求;同时对于可重构机器人的不同构型使得建模过程中所涉及的运动学参数也不同,在对其进行标定过程中分析包含对末端位姿影响较小的运动学参数在内的全部参数而构建的
随着信息科学技术的迅猛发展,人们对于室内定位的需求也越来越高。基于信道状态信息(CSI)的室内定位技术也逐渐成为研究热点,本文将CSI幅度信息和相位信息作为两种模态,开展基于深度学习的室内定位算法研究。论文主要工作包括:(1)研究基于信道状态信息进行室内定位的相关理论。首先介绍了信道状态信息的相关理论知识,然后介绍了基于CSI定位系统中常见的机器学习算法,最后介绍了多模态机器学习理论。(2)提出了
随着科技的快速发展,遥操作机械臂系统已经广泛应用于各种环境中,例如太空探索,考古探索,深矿挖掘,核工厂检测和远程手术等。对于遥操作控制系统,其最重要的性能要求是稳定性和透明性,但由于机械臂关节内部结构的复杂性及工作环境的不确定性,导致机械臂是一个典型的非线性、强耦合、时变不确定的系统,同时在快速操作机械臂时会导致执行器发生饱和,这些问题严重影响了遥操作系统的稳定性和透明性,为了达到良好的性能指标要