基于知识表达的迁移学习研究

被引量 : 0次 | 上传用户:czw6229835
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机信息技术的飞速发展,从海量数据中挖掘有用的信息并加以利用已经成为当前的研究热点。在数据挖掘中,传统的机器学习假设训练数据与测试数据具有相同的分布,而实际应用中往往并不能满足这一假设,即使勉强满足也大大降低了数据分析的效率。迁移学习方法能够有效地在相似的领域或任务之间进行信息的共享和迁移,使传统的从零开始的学习变成可积累的学习,具有成本低,效率高等优点,近几年成为数据挖掘和机器学习的关注焦点。迁移学习最大的特点就是利用相关领域的知识来帮助完成目标领域中的学习任务。但是,不同的知识表达方式直接影响迁移学习的效果。本文从知识的表达方式入手,对知识表达与迁移方法的结合方式展开研究,主要工作如下:首先,针对源领域数据和目标领域数据分布类似的情况,提出一种基于多源动态TrAdaBoost的实例迁移学习方法。该方法考虑多个源领域知识,使得目标任务的学习可以充分利用所有源领域信息;每次训练候选分类器时,所有源领域样本都参与学习,可以获得有利于目标任务学习的有用信息,从而避免负迁移的产生。理论分析验证了所提算法较单源迁移的优势,以及加入动态因子改善了源权重收敛导致的权重熵由源样本转移到目标样本的问题。实验结果表明,此算法在提高识别率和分类精度等方面的优势。其次,针对源领域数据和目标领域数据分布差别较大的情况,提出一种基于协方差矩阵的特征迁移学习方法。该方法采用相似学习估计个体参数的协方差对,从数据间特征联系出发,通过构造半正定规划来组合这些估计值并学习当前任务的先验值,构建多变量高斯先验的协方差矩阵,进而对未标记的数据进行有效预测。实验结果表明,所提方法利用少量的源任务即可得到较好的迁移学习结果。再次,针对共享知识是一些基函数的参数模型或先验分布的情况,提出一种基于层次贝叶斯的参数迁移学习方法。该方法定义任务相关性的层次概念,对标准Dirichlet过程模型进行扩展,建立多任务环境下的贝叶斯强化学习模型;有效学习类别数量、类型的推断过程以及用于探索新任务时的类别结构,从而更快地学习更多的知识。实验结果表明,提出的方法可以加快新领域中最优策略的收敛速度。最后,针对共享知识是规则、结构和逻辑等关联规则的情况,提出一种基于马尔可夫逻辑网的关联规则迁移学习方法。该方法首先利用伪对数似然函数,将源领域中马尔可夫逻辑网表示的知识迁移到目标领域中,建立两个领域之间的关联;通过对源领域进行自诊断、结构更新和目标领域搜索新子句,来优化映射得到的结构,进而适应目标领域的学习。实验结果表明,算法成功地映射了迁移知识,提高了学习模型的精确度。全文针对目前迁移学习研究中存在的部分问题,以如何利用源领域和目标领域间共享的不同知识表达方式为出发点,以提高目标领域的学习效率为目的,以不同的迁移方法为基本手段,对如何构造迁移环境和如何建立迁移环境下的有效迁移模型进行深入研究,提出了解决办法。实验结果验证了上述方法的可行性和有效性。论文研究成果丰富了迁移学习理论,为其在数据挖掘中的应用提供了有益的指导。
其他文献
目的研究益气消瘢法对雌激素诱导子宫肌瘤模型豚鼠子宫组织细胞外信号调节激酶2(ex-tracellular signal regulated kinase2,MEK2)、磷酸化激活丝裂原激活蛋白激酶的激酶(phosphor
随着基础教育课程改革的不断深化,小组合作和深度学习受到越来越多教育工作者的关注,合作学习被普遍运用到初中课堂教学中,同时也产生了一系列的问题,比如教师花了很多精力设
目的总结不同病因的肝脏囊性病变的超声、CT和(或)MRI影像学征象,以提高肝脏囊性病变的诊断正确率。方法复习国内外关于不同类型肝脏囊性病变的影像学研究的文献,以病因为线
目的:胃癌是源于胃粘膜上皮的恶性肿瘤,发病率及死亡率均很高。中国是胃癌高发的国家,发病率及死亡率均高于世界平均水平。虽然目前采取了包括手术、放疗、化疗及生物治疗等综合
十九世纪的法国,由于政治、经济、文化与教育等各方面原因促使雕塑成为男人的艺术,女性几乎没有接触雕塑艺术的权力。卡米耶·克洛岱尔身处传统社会对女性束缚的压力下,力图
摘要:企业文化是当代最前沿的企业管理思想和经营智慧。从世界范围来看,优秀的、符合企业发展特点的企业文化越来越受到中外各类企业的重视,并将其视为构建企业软实力、打造企
日本人的沉默性格已经深入到其生活的方方面面,成为民族文化的一部分。这种性格的形成是内外因素共同作用的结果。首先,是相对封闭狭小的岛国特征与相对单一的民族特性共同作
本文以建构主义理论为视角,从建构主义的认知过程中情境、协作、会话、意义构建等要素,探讨案例教学法在高校思想政治理论课的有效实施。
研究在氯仿溶液中用碳酸丙烯酯萃取银及某些影响因素,并提出银的萃合物形式及萃取平衡常数.在氯仿溶液中于22±1℃,pH0.2~3.0及15%PC-CHCl_3条件下,银的萃取率在97%以上.
目的与背景:人脑胶质瘤是中枢神经系统中最常见的肿瘤类型,占颅内肿瘤的50%~60%,5年存活率为仅为20%~30%。胶质瘤细胞呈浸润性和膨胀性生长,具有高发病率、高复发率、高病死率和低