基于半监督协同训练的文本情感分类研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：samdragon

【摘要】

：

随着Web2.0的快速发展,互联网上产生了大量的用户生成内容(User Generated Content)。这些用户生成内容包含大量有用的情感信息,对于用户决策和企业的产品改进等有着重要的价

【作者】

：

李宁宁

【出处】

：

合肥工业大学

【发表日期】

：

2015年期

【关键词】

：

文本情感分类协同训练半监督学习非均衡数据分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Web2.0的快速发展,互联网上产生了大量的用户生成内容(User Generated Content)。这些用户生成内容包含大量有用的情感信息,对于用户决策和企业的产品改进等有着重要的价值。因此,如何使用文本情感分类技术对海量的用户生成内容中的情感信息进行挖掘,已经成为学术界和产业界的一个热点问题。目前虽然基于机器学习的文本情感分类方法已经取得较好的结果,但是在实际应用中获取有标记样本需要消耗大量的人力,相反获取未标记样本却十分容易。因此,如何利用少量有标记样本和大量未标记样本进行文本情感分类已成为一个亟待解决的问题。为此本研究将半监督协同训练方法引入到文本情感分类方法当中,用于解决文本情感分类中未标记样本的利用问题。首先,本研究分析了文本情感分类和半监督学习的研究现状,明确了当前的研究问题和未来的研究方向。其次,本研究对文本情感分类和半监督学习的基础理论进行了系统研究,分析了文本情感分类的主要任务、文本情感分类的主要方法,以及半监督学习的基本假设、半监督学习的有效性和半监督学习的主要方法等基础理论。然后,以此为基础,本研究对基于半监督协同训练的文本情感分类方法进行了研究。考虑到当前已有研究还较少关注数据分布对文本情感分类的影响,本研究从数据分布是否均衡两个角度,分别构建了数据分布均衡条件下基于IDSSL的文本情感分类模型,以及在数据分布非均衡数据条件下基于混合策略的文本情感分类模型。最后,本研究将基于半监督协同训练的文本情感分类方法引入到实际应用中,通过选取电子商务和医疗社交媒体两个实际应用场景,分别对两类基于半监督协同训练的文本情感分类方法的有效性进行了检验。实验结果表明,本研究提出的方法在不同数据分布情况下均取得了较好的结果,从而验证了本研究提出方法的有效性。通过本研究,一方面将半监督学习方法引入到文本情感分类问题中,拓展了文本情感分类和半监督学习的基础理论,并以此为基础构建了基于半监督协同训练的文本情感分类模型。另一方面,将基于半监督协同训练的文本情感分类模型应用于具体实际问题中,拓展了文本情感分类和半监督学习的应用范围。

其他文献

通道费对零售商服务的影响研究

20世纪90年代,连锁超市以一种高效率的商业运营模式出现在我国零售业市场,并使得零售业市场结构发生很大变化。制造商为了进入零售卖场,占有更有利的卖场空间,获得零售商更多

学位

通道费零售商服务大型零售商本地零售商边缘零售商

论录音音频降噪处理在办案中的应用

随着科技的快速发展,微型话筒、小型摄像机、可拍照手机等录音、摄像设备的不断普及,为人们生活带来极大方便。但录音过程中,由于各种原因,所录音频出现一定响度噪声的情况时

期刊

音频降噪噪声电子证据

年内将有大批重印书出版

【正】为了尽快改变“书荒”现象,国家出版局最近决定,从北京和上海有关出版社已经出版的文艺书笈中,选出三十多种为当前广大读者迫切需要的中外优秀作品,迅速重印一批,首先

期刊

郭沫若李贺诗歌《东周列国志》《红旗谱》文学遗产古典文学名著曹禺选集黑格尔《子夜》国家出版局大批重

综合性护理用于小儿重症肺炎并发呼吸衰竭的效果研究

目的研究综合性护理用于小儿重症肺炎并发呼吸衰竭的效果。方法选取2016年3月—2018年1月在本院ICU治疗的重症肺炎并发呼吸衰竭患儿104例,随机分为对照组和观察组,每组各52例

期刊

综合性护理小儿重症肺炎呼吸衰竭

基于磁阻效应及细分技术的齿轮编码器设计与实现

编码器是闭环伺服控制系统的位置反馈元件,对伺服系统中电机的控制性能有着重要的影响。磁编码器具有高响应性、抗震等级高、防油污等特点。然而其具有分辨率不高,要求充磁精

学位

齿轮编码器磁阻细分伺服控制CORDIC

微量硼对ZCuZn40Pb2组织和脱锌腐蚀性能的影响

用圆杯倾出法试验考察微量硼变质处理和未变质处理ZCu Zn40Pb2凝固界面的组织形貌,研究微量硼对ZCu Zn40Pb2铸态组织和脱锌腐蚀性能的影响。结果表明,加入微量的硼可以明显地

期刊

微量硼铅黄铜壳杯试样组织脱锌腐蚀

考虑层间效应的钢纤维混凝土隧道单层衬砌受力特征模型试验研究

为探究考虑层间接触效应的钢纤维混凝土隧道单层衬砌内力分布规律,自行设计考虑与不考虑层间效应的单层衬砌模型并研制竖向油压5MPa和侧向压力1.5MPa作为逐级施加的卧式加载

会议

隧道工程钢纤维混凝土单层衬砌层间效应受力特征

馆藏西周“玉鹰”之赏析

玉鹰，西周玉器。高5.4厘米，宽7.6厘米，厚0.4厘米，重21克。玉质为青色，因轻度侵蚀，略呈鸡骨白色。玉鹰体扁平，作停立状。长颈前伸，圆目，钩喙，曲背垂翅，羽尾下收。两面纹饰相同，皆以阴线刺

期刊

阴线刻一面坡

乡村振兴文化为魂

<正>文化是一个国家、一个民族的灵魂,能够在人们认识世界、改造世界的过程中创造生产力、提高竞争力、增强吸引力、形成凝聚力。乡村振兴,既要"塑形",更要"铸魂";既要有"颜

期刊

乡村振兴精神动力智力支持

基于系统动力学仿真的政府补贴下废旧家电回收策略研究

我国正面临着非常严峻的资源短缺和环境污染问题。在废旧产品回收市场上,废旧家电的回收和处理方式很不正规,大部分报废的家电产品没有得到规范的处理,带来了严重的资源浪费

学位

系统动力学政府补贴废旧家电回收

基于半监督协同训练的文本情感分类研究

与本文相关的学术论文