机器学习中知识迁移方法研究

被引量 : 0次 | 上传用户:liongliong503
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的机器学习是基于统计学的机器学习,学习的任务就是在给定充分训练数据的基础上来学习一个分类模型,然后利用这个学习到的模型来对测试数据进行分类与预测。其中有一个基本的假设条件:训练数据与测试数据来自相同的特征空间而且服从相同的概率分布。但是在实际问题中,这种假设往往不成立,这样就导致学习到的模型无法很好的应用到测试数据上去,于是传统的机器学习技术就对这些问题的解决失去了效力。这往往需要我们去重新标注大量的训练数据以满足我们训练的需要,但标注新数据是非常昂贵的,需要大量的人力与物力。从另外一个角度上看,如果我们有了大量的、在不同分布下的已标记的训练数据,完全丢弃这些数据也是非常浪费的。如何合理的利用这些数据就是迁移学习主要解决的问题。目前根据源数据集和目标数据集中数据标记的情况不同,迁移学习可以划分为三类:归纳式迁移学习,直推式迁移学习和无监督迁移学习,其中前两种迁移学习是当今研究的热点。根据迁移对象的不同,现今解决迁移学习问题的方法可分为四种:实例迁移法,主要是通过挑选和提取对目标数据集训练有帮助的样例进行权重重组,将其作为辅助训练数据来帮助目标数据空间的学习;特征代表迁移法,主要是寻找一个“好”的特征代表来最小化各个特征空间或者分类器、回归模型之间的差异;参数迁移法,寻找源数据空间模型和目标数据空间模型之间的共同的参数或者前提来进行进一步处理达到知识迁移的目的;关联知识迁移法,通过建立源空间数据的关系模型与目标空间数据的关系模型的映射模型来实现知识的迁移,并假定两个数据空间是相关的而且各自服从独立同分布假设。本文对归纳式迁移学习进行了重点研究,在总结几种主流的迁移学习解决方法的基础上,提出了三种算法:基于数据集动态重组的集成迁移学习。算法首先将大量旧的已标记数据进行随机等量分割,把得到的旧数据的各个分块分别与少量的新已标记数据组合得到多个重构的训练数据集,然后分别训练分类器得到一个集成分类器,利用它对样例进行权值的更新,最后得到最终的集成分类器。基于神经网络误差分析和数据重组的集成迁移学习。首先利用已标记的目标数据训练一个神经网络分类器模型,然后把源数据集中的样例输入该模型中,利用输出的误差来为该样例的权重进行初始化,再利用分割重组的方式重组数据集并训练分类器,最后进行分类器的集成。基于向量平移和模糊聚类的迁移学习。为了让源数据与目标数据在特征空间中有尽可能大的交集,利用向量平移的方式将两者尽量重叠起来,然后把目标数据集的各类中心点作为聚类中心对平移后的数据进行模糊聚类,得到每个样例隶属于各个类别的模糊隶属度来为其加权,最后训练分类器。
其他文献
随着"互联网+"的不断推进,我国银行业也不甘示弱,不断引入信息技术,诸多方面提高了效率。在银行支付结算领域的产品更是雨后春笋般涌现,不断推动"现钞化"到"无先进城市"的快
鉴于传导EMI最终是以电流的形式注入敏感设备形成干扰,为此在分析了电机系统漏电流的传播途径的基础上,提出通过在电力电子器件与散热器之间置入高电导率金属屏蔽层,以此减小两
罗兴亚人是缅甸境内最大的一个穆斯林群体,但由于历史、宗教文化、政治军事及经济等多方面原因,缅甸当局将其视为孟加拉的非法移民,并对其实施了残忍的种族清洗,使得罗兴亚近
创新驱动发展战略已经上升到决定中华民族前途命运的高度,而知识产权法律制度则是支持创新驱动发展的制度保障。创新驱动发展战略如何在功能上对我国知识产权法律制度进行完
煤矿工人腰背痛流行病学调查中国煤矿工人泰山疗养院271000陈长力,李守彬,张乐军,李新东,姜衍贤,赵景才,张兴倜,傅云芬,董金辉为进一步了解煤矿工人腰背痛的患病情况,探索其影响因素,为矿工腰
虫草是一类珍稀的药用真菌资源,其代谢产物和生物活性具有多样性特点,在功能性食品和生物医药领域展现出巨大的应用前景。虫草物种资源丰富,其中冬虫夏草是我国最名贵三大补
上消化道狭窄是经皮内镜下胃造瘘术(PEG)的适应证,但是严重的上消化道狭窄给PEG的顺利进行带来了极大的挑战。该文报道了一例因口咽部恶性肿瘤导致上消化道严重狭窄的患者,在
<正>一四月,学院的考试在一片轰隆隆的声音中结束,仿佛一票强盗,挥舞着沉重的兵器,跨着嘶叫的战马,洗劫一番之后,扬长而去。蓦然进入假期,我有些无所适从,认识的几个朋友也各
鄂 6 6 378是由SKUA/86 5 14 6 //6 15 0 6组合经系谱法选育而成 ,该品种在品质指标达到中筋国标的优质基础上 ,省区试产量 2年平均比对照鄂恩 1号增产 8.5 7% ,中抗条锈病和
鲜切果蔬由于天然、营养、新鲜、方便以及可利用度高(100%可食用)等特点,可满足人们追求天然、营养、快节奏的生活方式等方面的需求,具有巨大的发展潜力。本论文针对浅色鲜切