领域自适应算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:flowerofwind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的监督学习假设训练(源域)与测试(目标域)数据都来源于相同的联合概率分布。然而,在自然语言处理、计算机视觉等领域,训练数据常常来源于一个源域联合分布,而测试数据则来源于一个不同的目标域联合分布。由于存在联合分布(领域)之间的差异,简单地使用源域数据训练而来的分类或回归模型,在目标域数据上往往表现不佳。领域自适应的出现正是为了解决这个问题,使得预测模型在目标域有比较好的泛化性能。本文从概率分布适配的角度,对领域自适应进行了逐步深入的研究,包括它的无监督以及半监督两种典型的设定。本文的主要工作如下:1)协移自适应是基于协变量偏移假设的无监督领域自适应。针对协移自适应中的过度加权问题,提出了一个自适应加权结构风险最小化方法(Adaptively Weighted Structural Risk Minimization,AWSRM)。值得一提的是,协移自适应是基于协变量偏移假设的无监督领域自适应。在所提出的方法中,目标域预测模型和调整后的权重向量可以通过同时最小化预测模型的加权结构风险与权重向量的平方损失而学得。在多个回归和分类数据集上的系统性实验验证了所提方法相对于其他协移自适应算法的优越性。2)考虑到协变量偏移假设在无监督领域自适应问题中的局限性,本文首次引入了广义协变量偏移的假设。在该假设的基础上,本文运用一个分布自适应函数在子空间里调整源域分布,使其接近目标域分布,并同时在调整的源域联合分布上训练一个目标域分类器。具体地,本文提出了两个框架用于实现这一目的:嵌入式布雷格曼散度结构风险最小化框架(Bregman-divergence-embedded Structural Risk Minimization,BSRM)与联合结构风险最小化框架(Joint Structural Risk Minimization,JSRM)。进一步地,本文证明了在特定的条件下,从这两个框架中都可以导出凸优化问题。在模拟数据集和真实数据集上的实验表明,所提方法优于其他的对比算法。3)协移自适应和广义协移自适应算法解决的都是源域与目标域边际分布的差异性问题。为了进一步解决两个域的条件分布(标签分布)也存在差异性的问题,本文提出了一种直接联合分布适配方法(Direct Joint Distribution Matching,DJDM),在总变异距离、KL散度、黑林格距离、卡方散度这几种f散度下,以线性或非线性的方式,直接地适配源域和目标域的联合概率分布。从黎曼几何的角度,本文将模型的求解问题形式化为格里斯曼流形上的优化问题。在若干个分类和回归数据集上的实验评估表明,所提的方法在统计意义上胜过已有的浅层领域自适应方法,并且在性能上可与深度方法媲美。4)提出了一种非对称联合分布适配(Asymmetric Joint Distribution Matching,AJDM)方法来解决半监督领域自适应问题。该方法在相对卡方散度下,利用一对映射矩阵来适配源域和目标域的联合概率分布。进一步地,本文还将所提的方法拓展成一种核化的方法,以更加灵活的方式对联合分布进行适配。从黎曼几何的角度,本文将学习映射矩阵的问题形式化为积流形上的优化问题。在文本和图像数据集上的实验表明,本章的方法优于现有的浅层和深度半监督领域自适应方法。
其他文献
新型冠状病毒(SARS-CoV-2)引发的2019冠状病毒病(COVID-19)疫情形势严峻,排除疑似患者、治疗确诊患者、抢救重型/危重型患者仍是防控和救治主要工作。近日,中国疾病预防控制中心专家在JAMA上发表的研究分析7万多例COVID-19患者流行病学特征,其中核酸检测阳性确诊患者轻型占81%,重型占14%,危重型占5%,危重型患者中病死率高达49.0%[1]。重型/危重型患者常伴有严
为提高人机协作(HRC)装配的柔顺性,需要对人的协作意图进行识别,从而引导协作机器人更好的辅助工人完成装配作业。针对人机协作装配场景下基于单源生理电信号识别协作意图准确率不高、稳定性不好的问题,首先采用支持向量机方法(SVM)分别从EEG脑电和EMG肌电信号识别单源协作装配意图,然后采用D-S证据理论对多源协作装配意图识别结果进行融合,提出了一种融合EEG-EMG生理信号的人机协作装配意图识别方法
当前,我国处于经济体制不断改革的过程中,随着全球化的推进和市场经济的扩张,市场竞争加剧,房地产行业也受到到了极大的影响,出现较多问题。以群众住房问题为代表,受到经济和社会等多方面因素的影响。也正因为如此,本文基于经济新常态的国内环境,通过对房地产行业的经济竞争环境以及当前房地产面临的问题进行深入探究,进而提出一些解决办法,促进我国房地产行业的健康发展。
10月11日,广西贵港市覃塘区黄练镇张团村敬老院收到一份重阳"大礼"——南方电网广西贵港供电局老董党员服务队为敬老院检查室内外电力线路,消除安全隐患,更换老旧开关,并送上重阳节慰问品。看到这一切,91岁的张必乖老大爷笑得合不拢嘴。这是贵港供电局聚焦"我为群众办实事"实践活动,提升群众用电体验的一个缩影。
期刊
随着BIM轻量化技术的不断发展,BIM技术越来越多地应用在建筑运维阶段;本文通过调研BIM轻量化展示和微服务架构等关键技术,提出了一种结合BIM技术的绿色园区运营优化平台架构,梳理了绿色园区运营阶段的平台功能需求及与BIM的融合,最后通过实际项目验证了平台设计架构和功能,提升了绿色园区运营管理水平。
目的应用宏基因组学二代测序(metagenomics next generation sequencing, mNGS)技术检测重症肺炎真菌感染患者病原体,探讨其诊断重症肺炎真菌感染的临床应用价值。方法重症肺炎真菌感染患者20例,其中经传统病原微生物培养(痰培养、肺泡灌洗液/胸腔积液培养)明确病原学17例,另3例符合临床诊断标准,但未明确病原学。收集患者肺泡灌洗液标本19例,胸腔积液1例,并采用m
复习的目的是帮助学生巩固已学知识,提高应用能力。小学数学学科的知识点多且繁杂,复习课效率并不理想。针对这一问题,教师可以运用思维导图帮助学生快速整理知识点,寻找和突破自己的薄弱环节,提升数学综合能力。本文分析了在小学数学复习课中运用思维导图的作用,并对如何运用思维导图提升复习课效率进行了探讨。
最近,亨斯迈集团下属上海亨斯迈聚氨酯有限公司与上海集韧新材料科技有限公司签署战略合作协议,双方将以亨斯迈生产的二苯基甲烷二异氰酸酯(MDI)聚氨酯为基体,以玻璃纤维为增强材料,展开新一代环保节能门窗型材的联合开发与升级焕新。亨斯迈凭借其性能优异、减碳环保的聚氨酯复合材料解决方案,与集韧科技强强联手,以创新驱动差异化竞争力、助力客户高质量发展,积极推动国内建材行业的绿色转型升级。
期刊
目的探讨乳腺癌患者颈内静脉输液港导管堵塞的影响因素,并提出针对性预防护理对策。方法以2019年1月至2021年1月厦门大学附属妇女儿童医院收治的98例乳腺癌患者为研究对象,所有患者术后均留置颈内静脉输液港进行化疗,根据是否发生导管堵塞分为两组,比较两组临床资料,分析颈内静脉输液港导管堵塞的危险因素。结果 98例患者中,13例发生导管堵塞(导管堵塞组),85例未发生导管堵塞(未堵塞组)。单因素分析结
纳米孔平台是一种廉价、无标记、高灵敏且高通量的单分子传感系统,近二十年来日益受到人们关注。其中,固态纳米孔具有几何结构简单,便于控制形貌等优点,受到人们的重视。由于其尺度较小的缘故,纳米孔中的流体性质及离子分布也与宏观情况下有较大差异,因此,拓展固态纳米孔在分析检测中的应用的同时,对其内部的传质特性进行研究,对于纳米孔平台的进一步发展有重要意义。对此,本研究构建了一系列功能化固态纳米孔,并将它们用