基于词向量预训练的不平衡文本情绪分类

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:zhou20p
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习中处理不平衡问题的方法多为代价敏感和采样。该文在词向量迁移的基础上提出预训练任务选择方法。用利于小类别区分的预训练词向量来初始化目标模型,并结合均衡过采样充分利用样本信息保持模型在大类别上的精度,使模型提取的文本特征在大小类别上具有公平性,从特征层面实现了平衡效果。实验结果表明,在文本情绪分类任务中,对比过采样方法,该方法在大部分无严重过拟合情况下有更好的平衡效果。当存在较严重过拟合时,该方法在目标分类数为三时平衡效果显著,并通过实验验证了预训练方法可与代价敏感方法相结合提升平衡性能。
其他文献
当前我国已有的风险研究管理以及企业的风险实践,一般集中在经营以及财务和资本市场的风险中。文章通过金融创新的情况之下,我国企业所面临的整体风险谈起,分析资产的特性,将
目的 探讨反复呼吸道感染 (RRI)与纤毛结构异常的关系 ,统计此特殊人群中原发纤毛运动障碍 (PCD)的发生率。方法 在纤维支气管镜直视下对临床诊断为RRI的入选患儿行支气管
本文以马克思主义与基督教的对话为背景,从马克思主义和基督教建立未来大同社会的共同愿望出发,从实践、阶级关系、人的解放三个方面对二者进行分析,试图为双方至少在一定范
在这个信息时代,人们生活生产中已经不能缺少通信技术这项关键的技术,为改善人们的生活质量与工作效率有非常大的作用。现阶段,通信业处于急剧发展的时代,发展的业务造成电信
建立了一个三维的数学模型来模拟研究质子交换膜燃料电池,以及流道里流体的流动、阳极氢气和阴极氧气各组分的传递、热量传递、电荷传递、和氧化还原的电化学反应动力学,得到
目的探讨支气管镜下球囊扩张治疗气道狭窄的疗效和安全性。方法对山东大学齐鲁儿童医院呼吸介入科2008年10月至2011年8月收治的156例气道狭窄患儿,实施支气管镜介导下球囊扩
所谓企业文化,是指企业在生产经营活动中逐步形成的由企业全体职工共同持有的价值观念、思维方式、传统习惯、行为准则等。企业文化现已成为企业生存与发展的关键之一。所谓
将机械化技术引进花生生产的全过程,有助于花生生产水平的提升,为农民创造更高的经济收益。基于此,本文通过具体分析花生生产全程机械化技术的要点,旨在增强花生生产的效益。
当前我国规划咨询存在相关机制不健全、缺乏引导和规范等方面的问题,影响了城市规划咨询功能的有效运行。可构建由咨询机构、城市规划专家委员会和公众咨询组成的AEP咨询体系
医院是为广大人民群众提供服务的医疗机构,随着经济发展。人们对医疗技术水平和服务能力的要求也越来越高。为了更好地实现医院服务大众的价值。加强医院政工工作建设是重要措