基于最大熵模型的迁移学习算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:mathsboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的机器学习和数据挖掘算法大多基于这一假设:训练数据集和测试数据集具有相同的特征空间和数据分布,因而更侧重于与其他任务或者先前学习到的知识相互独立的单任务学习。然而,在实际应用中,特征空间和数据分布常常发生变化,因此需要花费大量的时间和精力去重新收集大量的标记数据并训练新模型。迁移学习是一种新的学习框架,其旨在使一个系统具有识别和应用先前任务中学习到的知识和技巧于新的任务或领域的能力。本文针对归纳迁移学习和直推迁移学习这两个分支,分别从单领域迁移和多领域迁移两方面展开了迁移学习算法的研究,提出了基于最大熵模型的加权归纳迁移学习算法WTLME和集成直推迁移学习算法SFEC。主要工作如下:(1) WTLME着重于解决单领域迁移的归纳迁移学习问题,通过将已训练好的原始领域模型参数迁移到目标领域,并对目标领域实例权重进行调整,来获得目标领域准确率较高的分类器模型。通过在Web网页数据集和评论数据集上的大量实验表明了该算法的有效性。(2)为进一步提高迁移学习在评论数据集上的情感分类的准确率,在WTLME的基础上提出了基于最大熵模型的集成直推迁移学习算法SFEC,该算法在多个原始领域标记数据集和目标领域未标记数据上训练一个集成分类器,并对未标记数据进行预标记,然后选出预标记可信度高的目标数据反馈到集成分类器中进行迭代训练,以保证进一步提高目标领域模型的准确率。通过在评论数据集上的大量实验表明SFEC确实提高了目标领域模型的准确率,并且缓解了“负迁移”现象。
其他文献
在软件生产领域中,系统需求分析是软件生产的基础,业务模型应当与系统需求保持一致才能保证软件质量。对于业务模型如何根据需求的变化而快速和正确的修改,已经成为软件领域
随着互联网技术的发展和移动通讯工具的普及以及微信、微博等社交平台的广泛应用,以提高交流效率或者表达某种情感为目的的、采用包含有自创、缩略词语、特定符号及其独立或者
学位
集群行为是对现实生活中的生物群体和人工群体的一种高度抽象。单一智能个体只能完成比较简单的任务,但是由很多智能个体组成的多智能体系统能够通过个体间的相互作用涌现出集体智能,完成比较复杂的任务,解决现实生活中很多难以解决的问题。在当前社会中,多智能体系统已经广泛的应用到人们生活的方方面面,包括环境监测、灾难搜救、军事行动和工业操作等等诸多领域,对多智能体系统的研究具有重要的理论和现实意义。为了更好的分
随着工作流技术的日趋成熟,越来越多的企业开始采用它作为提高企业效率的手段。工作流管理系统主要用于协调商业过程的执行,这些过程往往涉及到分布的资源。随着企业组织越来
细分曲面既具有多边形网格的拓扑任意性,又具有参数曲面的连续性、一致性和仿射不变性等优点,因而在曲面造型中得到了非常广泛的研究与应用。自适应细分技术解决了均匀细分产
人工神经网络(Artificial Neural Network)是一种旨在模仿人脑结构及其功能的信息处理系统,它是对人脑神经网络的简化、抽象与模拟。目前已有上百种的人工神经网络模型,这些
不同种类的纤维纺织品,其强度、截面粗细、纵向长度、卷曲度等特征信息均不相同。同一种类的纤维纺织品也会存在个体差异。这些特征信息是判断纤维对象成熟度的重要标准,是纤
无人飞行器航迹规划就是在特定约束条件下,寻找满足无人飞行器机动性能及战场环境限制的,从出发点到目标点的最优飞行轨迹,是无人飞行器进行自主飞行的关键技术。本论文针对
随着无线网络技术的广泛应用,无线局域网(WLAN)的相关技术也越来越成熟,WLAN以其灵活性和移动性等优势成为网络技术领域的热点话题,同时WLAN也因其自身固有的特点,如传输介质的开放