基于自学习的直推式迁移学习方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:aihechashui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实际应用中,相对于数据的大量、快速产生,对应的标记信息获取却十分困难,如Web评论数据,在线交易等,使得已有的数据挖掘算法面临着巨大的挑战。为此,迁移学习的研究受到了广泛的关注。迁移学习是一种能够从已有的任务中获取对新任务学习有利的知识并加以利用,且不受独立同分布条件的限制。本文面向产品评论数据的情感分类应用,基于自学习思想对直推式迁移学习展开研究,主要工作如下:(1)首先对迁移学习进行了总体地概述,包括其出现的必要性和发展背景、迁移学习的主要研究问题与分类以及迁移学习的研究现状与应用;(2)为了更好地利用多个原始领域知识以及解决相对“较差”的原始领域对迁移的负面影响,本文提出了基于类别分布的多领域动态适应算法MDACD。该算法通过动态处理多个原始领域使它们不断向目标领域靠拢,从而更好地向目标领域迁移知识。同时该算法利用类别分布信息来选择原始领域,在一定程度上消除了那些相对“较差”的原始领域对迁移学习的影响。从大量的实验可以看出该算法达到了预期的效果;(3)为了解决原始领域中相对“较差”的实例对迁移的负作用,本文提出了基于实例重构的多领域适应算法MAIR。该算法利用原始领域多个相关实例重构目标领域实例,充分地利用了原始领域中与目标领域相关的实例,避免了那些相对“较差”的原始领域实例对迁移的负面影响。从实验结果可以得知该算法在分类性能和时间性能上都取得了较大的优势;(4)为了更好地应用本文所提出的算法,文章在最后面向商品评论的情感分类问题设计了跨领域情感分类原型系统。该系统集成了数据在线获取和算法执行两部分功能,在实际应用中取得了较好的结果。
其他文献
随着计算机软件、网络技术不断发展,基于B/S架构的.NET应用程序因其实用性强被广泛地应用于各种管理系统。当前高职高专教材管理使用的单机版或C/S架构为主的教材管理系统还
当下,我们生活在一个信息爆炸式增长的时代。为了缓解人们面临的“信息过载”问题,推荐技术应运而生。推荐技术旨在利用用户的兴趣信息向其推送其可能感兴趣或可能需要的信息。
近年来无线传感器网络(Wireless Sensor Network, WSN)凭借其广泛的应用以及潜力受到各国杰出研究者的追捧,掀起了一股研究热潮,而基本所有应用都涉及到节点如何定位的问题。所谓
旋转轴是机械设备的核心部件,通过检测、分析旋转轴振动信息能够及时地获取设备的运行状况,因此旋转轴振动信号检测对设备状态诊断具有重要意义。为满足市场对小型化、低成本
跨文本指代是指在多个文档中多个指代词指向同一个实体,它主要面临的问题多名现象和重名现象。跨文本指代消解的任务就是要解决多名现象和重名现象,即进行多名聚合和重名消歧
近年来,互联网的发展可谓一日千里,由其引发的企业信息化的改革也是如火如荼,改革的快慢大大影响着企业在竞争激烈的市场中的发展。建立企业邮箱是企业信息化的一个重要组成
随着电子技术、计算机技术的迅猛发展和半导体工艺的逐步成熟,LED(发光二极管Light-EmittingDiode)凭借体积小、功率低、使用寿命长、高亮度、低热量、环保、坚固耐用等诸多
网络购物已经成为人们生活中不缺少的购物方式。它具有方便、快捷等特点,使用户能够足不出户浏览和购买想要的商品。人们通过网络会话的方式向客服咨询商品信息。客服通常会同
近年来,随着互联网的迅速发展,越来越多的人选择在线消费他们所需的服务,来代替传统的消费模式。这样的新型模式,不仅提供给消费者更多的选择空间,而且能帮助他们节省消费时