基于最大熵模型的迁移学习算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：mathsboy

【摘要】

：

传统的机器学习和数据挖掘算法大多基于这一假设:训练数据集和测试数据集具有相同的特征空间和数据分布,因而更侧重于与其他任务或者先前学习到的知识相互独立的单任务学习。

【作者】

：

梅灿华

【机构】

：

合肥工业大学

【出处】

：

合肥工业大学

【发表日期】

：

2011年期

【关键词】

：

数据挖掘机器学习迁移学习最大熵

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

传统的机器学习和数据挖掘算法大多基于这一假设:训练数据集和测试数据集具有相同的特征空间和数据分布,因而更侧重于与其他任务或者先前学习到的知识相互独立的单任务学习。然而,在实际应用中,特征空间和数据分布常常发生变化,因此需要花费大量的时间和精力去重新收集大量的标记数据并训练新模型。迁移学习是一种新的学习框架,其旨在使一个系统具有识别和应用先前任务中学习到的知识和技巧于新的任务或领域的能力。本文针对归纳迁移学习和直推迁移学习这两个分支,分别从单领域迁移和多领域迁移两方面展开了迁移学习算法的研究,提出了基于最大熵模型的加权归纳迁移学习算法WTLME和集成直推迁移学习算法SFEC。主要工作如下:(1) WTLME着重于解决单领域迁移的归纳迁移学习问题,通过将已训练好的原始领域模型参数迁移到目标领域,并对目标领域实例权重进行调整,来获得目标领域准确率较高的分类器模型。通过在Web网页数据集和评论数据集上的大量实验表明了该算法的有效性。(2)为进一步提高迁移学习在评论数据集上的情感分类的准确率,在WTLME的基础上提出了基于最大熵模型的集成直推迁移学习算法SFEC,该算法在多个原始领域标记数据集和目标领域未标记数据上训练一个集成分类器,并对未标记数据进行预标记,然后选出预标记可信度高的目标数据反馈到集成分类器中进行迭代训练,以保证进一步提高目标领域模型的准确率。通过在评论数据集上的大量实验表明SFEC确实提高了目标领域模型的准确率,并且缓解了“负迁移”现象。

其他文献

需求模型到业务模型的自动映射研究与实现

在软件生产领域中,系统需求分析是软件生产的基础,业务模型应当与系统需求保持一致才能保证软件质量。对于业务模型如何根据需求的变化而快速和正确的修改,已经成为软件领域

学位

模型转换模型驱动架构需求模型业务模型

基于微博语料的网络语言分析与识别

随着互联网技术的发展和移动通讯工具的普及以及微信、微博等社交平台的广泛应用，以提高交流效率或者表达某种情感为目的的、采用包含有自创、缩略词语、特定符号及其独立或者

学位

新词识别互信息统计模型隐马尔可夫模型微博语料网络语言

PubMed Central文献中的柱形图信息抽取研究与应用

学位

有限感知蜂拥集群模型噪声问题的研究

集群行为是对现实生活中的生物群体和人工群体的一种高度抽象。单一智能个体只能完成比较简单的任务,但是由很多智能个体组成的多智能体系统能够通过个体间的相互作用涌现出集体智能,完成比较复杂的任务,解决现实生活中很多难以解决的问题。在当前社会中,多智能体系统已经广泛的应用到人们生活的方方面面,包括环境监测、灾难搜救、军事行动和工业操作等等诸多领域,对多智能体系统的研究具有重要的理论和现实意义。为了更好的分

学位

集群智能多智能体系统一致性算法噪声抑噪算子稳定性

工作流平台信息安全问题研究

随着工作流技术的日趋成熟,越来越多的企业开始采用它作为提高企业效率的手段。工作流管理系统主要用于协调商业过程的执行,这些过程往往涉及到分布的资源。随着企业组织越来

学位

工作流平台访问控制基于角色的访问控制安全策略信息安全

细分曲面造型中关键技术的研究

细分曲面既具有多边形网格的拓扑任意性,又具有参数曲面的连续性、一致性和仿射不变性等优点,因而在曲面造型中得到了非常广泛的研究与应用。自适应细分技术解决了均匀细分产

学位

统一细分模式自适应细分拓扑裂缝半边数据结构二维组合映射曲面造型

基于遗传算法的BP神经网络在网络数据抓取中的研究

人工神经网络(Artificial Neural Network)是一种旨在模仿人脑结构及其功能的信息处理系统,它是对人脑神经网络的简化、抽象与模拟。目前已有上百种的人工神经网络模型,这些

学位

遗传算法BP神经网络基于遗传算法的BP神经网络网络数据抓取

多焦面纺织纤维图像融合的研究

不同种类的纤维纺织品,其强度、截面粗细、纵向长度、卷曲度等特征信息均不相同。同一种类的纤维纺织品也会存在个体差异。这些特征信息是判断纤维对象成熟度的重要标准,是纤

学位

模值计算区域划分闽值去噪图层融合评价函数

无人飞行器航迹规划的研究

无人飞行器航迹规划就是在特定约束条件下,寻找满足无人飞行器机动性能及战场环境限制的,从出发点到目标点的最优飞行轨迹,是无人飞行器进行自主飞行的关键技术。本论文针对

学位

无人飞行器航迹规划遗传算法启发式实时航迹规划协同航迹规划

WLAN环境下入侵检测防御系统的设计与实现

随着无线网络技术的广泛应用，无线局域网（WLAN）的相关技术也越来越成熟，WLAN以其灵活性和移动性等优势成为网络技术领域的热点话题，同时WLAN也因其自身固有的特点，如传输介质的开放

学位

入侵检测防御系统无线局域网加密算法网络技术

基于最大熵模型的迁移学习算法研究

与本文相关的学术论文