基于迁移学习的文本分类算法研究

来源 :中国矿业大学(北京) | 被引量 : 0次 | 上传用户:yatou5004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
迁移学习技术因其领域间知识、技能和经验的迁移能力,已成为跨领域文本分类的重要手段和研究热点。本文通过总结迁移学习在文本分类中的应用与发展情况,针对目前该领域存在的一些问题、难点进行了分析和研究,并提出几种新的迁移学习算法。其中,针对文本分类中普遍存在的维数灾难及特征词义不明确,而易导致分类精度过低及过拟合等问题,提出了集特征选取与抽取为一体的特征降维方法—HLK;针对文本分类中源领域与目标领域间文本数据在数量及相似性等方面的特点,分别提出两种基于实例的迁移学习方法-CGTL与IDRTAT;针对源领域数据集与目标领域数据集中数据分布差异过大,提出一种基于特征的迁移学习算法-BFRTL,并通过实验验证了各算法有效性。
其他文献
统一战线是中国革命与建设取得胜利的三大法宝之一,而在新的历史时期,统一战线已经成为全体社会主义劳动者、社会主义事业的建设者、拥护社会主义的爱国者和拥护祖国统一的爱国
“模糊”有别于“含糊”,是语言的内在本质,有助于增强语言的美感。造成语言模糊性的原因是多方面和极其复杂的,文章就思维过程、语言的有限性及人们的审美共鸣等方面做简要分析
统一建模语言(United Modeling Language, UML)是一种描述功能强大且含义直观的可视化建模语言,它提供了多种图元,能够从不同角度和应用层次刻画系统特性,建模复杂的系统行为
词汇语义网是以词义与语义关系为经纬建立的人类语言知识表达基本架构。本文在吸收和借鉴WordNet及中文词汇语义网研究的理论与方法的基础上,结合蒙古文信息处理的现状,并充
基于宏观数据的研究表明,外商直接投资可能降低或提升劳动收入份额,本文试图利用微观数据解决这类结论上的矛盾。微观数据研究可解决数据平滑群体差异的局限,且能区分劳动者
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正>广西医科大学急诊医学学科成立于1985年,目前已成为集医疗、教学、科研和医学救援于一体的急诊急救中心,是国家重点建设专科学科、急诊医学硕士学位和博士学位授予点和全
在当前这个网络环境下,医院图书馆也实现了向信息化服务模式的过渡。文章针对医院图书馆信息服务方式,分析了信息化图书馆特点以及需要达到的要求,最后阐述了提供信息化服务的几
随着无人机技术的发展与成熟,无人机航拍图像在道路维护、交通事故勘察、城市路网地图构建等方面开始发挥重要的作用。当前主流的基于特征描述子匹配的图像拼接算法难以处理
虚拟装配技术为制造业带来了全新的设计理念,从本质上将传统制造从设计到生产的不断修改、多次试制的过程中解脱出来。装配工艺规划是虚拟装配最核心的部分,本文侧重基于智能