【摘 要】
:
随着信息的快速增长,越来越多新领域逐渐兴起。在这些领域中,可获得的数据一般是无标记的或有限的。针对如何根据小样本或无标记样本训练出高精度预测模型的问题,我们可迁移源域的知识到目标域,但域间的分布通常是不一致的,为了解决该问题,域适应被提出并成为了机器学习重要研究主题之一。因此,本文针对两种新的域适应场景分别提出了基于参数迁移的方法,具体场景和方法如下:(1)由于在实际场景中,获取大量数据的标签耗时
论文部分内容阅读
随着信息的快速增长,越来越多新领域逐渐兴起。在这些领域中,可获得的数据一般是无标记的或有限的。针对如何根据小样本或无标记样本训练出高精度预测模型的问题,我们可迁移源域的知识到目标域,但域间的分布通常是不一致的,为了解决该问题,域适应被提出并成为了机器学习重要研究主题之一。因此,本文针对两种新的域适应场景分别提出了基于参数迁移的方法,具体场景和方法如下:(1)由于在实际场景中,获取大量数据的标签耗时耗力。因此,针对无标记大样本源域知识到无标记小样本目标域的迁移场景,即完全无监督域适应(WUDA),本文受软大间隔聚类启发提出了一种基于模型参数字典稀疏表示的方法。该方法在源域和目标域的模型参数间进行互适应参数字典学习以实现知识迁移,同时引入l2,1范数来约束字典系数矩阵,使得各域权重可从公共字典中自适应地选择,从而实现域适应学习。(2)在实际问题中,不同的场景会关注不同的问题。故而本文针对多个无标记目标域提出了一种新的无监督域适应场景——多目标无监督域适应(1SmT),该场景打破了现有域适应对标记域需一致的假设,即为广义域适应。为了解决1SmT问题,本文提出了一种模型参数自适应迁移框架(PA-1SmT),该框架不仅实现了源域到目标域的UDA,也实现了目标域间的WUDA,其核心思想是联合源域和目标域构建目标公共参数字典,然后使用该字典稀疏表示每个目标域,从而实现域间知识迁移。由于此类方法迁移的是模型参数而非数据本身,因此可直接用于域适应的隐私保护。最后,通过相关实验验证了本文所提方法的显著有效性。
其他文献
在新形势下,社会经济的发展速度不断加快,医院也有着越来越高的财务管理水平要求,进而将医院财务管理进行不断创新与完善是十分重要的。
目的探析奥美拉唑、阿莫西林、克拉霉素联合半夏泻心汤治疗幽门螺杆菌感染慢性胃炎的疗效。方法选取我院2014年10月~2016年6月收治的慢性胃炎患者100例作为研究对象,由于治疗
游轮业的快速发展给旅游院校和游轮企业带来了挑战和动力。本文概述了我国涉外游轮业人才的现状,分析了当前我国涉外游轮专业人才培养在旅游院校,教师队伍、学生和游轮企业四
<正>"如果有一个稳定的现金流,就将它证券化。"这句华尔街的名言完美的阐述了资产证券化在金融活动中的重要地位。在经济下行所带来的"资金荒"迫使企业努力开拓新的融资渠道
目的:探讨半夏泻心汤联合奥美拉唑治疗胃溃疡的临床疗效。方法:将本病患者100例随机分为治疗组和对照组各50例,第1周两组均予以根除幽门螺杆菌三联疗法治疗,第2~8周治疗组予
胸膜病理学检查是明确胸膜疾病诊断的重要方法。目前,闭式胸膜活检是仍胸膜组织获得最为常用的方法,其中Abrams活检针和Cope活检针临床应用最为广泛。然而,我们在临床应用中
中小企业是我国国民经济的重要组成部分,在整个社会经济发展中起着举足轻重的作用。然而,融资难是制约中小企业发展的重要因素,因此在互联网金融背景下对中小企业融资模式进
近日,歌力思发布公告称,公司此前以2.77亿元收购上海百秋网络科技有限公司(以下简称“百秋网络”)75%的股权已经完成工商变更登记手续,并取得了上海市工商行政管理局换发的新
基于阵列信号处理的高精度测向算法被广泛研究,然而基于阵列天线的测向系统在工程实现过程中无法避免的存在天线单元耦合、天线单元一致性差等问题,导致实际系统的测向精度与
虾夷扇贝(Mizuhopecten yessoensis)个体大、味道鲜美、营养丰富,是我国北方沿海地区最重要养殖品种之一。但近年来,虾夷扇贝度夏时愈发严重的死亡率给扇贝养殖业带来了巨大的经济损失。本课题组经过长期选育,培育出虾夷扇贝新品种“明月贝”,在应答夏季高温时具有很好的耐受性。本研究以普通虾夷扇贝(对照组)和白贝(“明月贝”品系)为实验材料,采用实验室内高温模拟与自然海区夏季高温实地验证结