基于半监督协同训练的文本情感分类研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:samdragon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的快速发展,互联网上产生了大量的用户生成内容(User Generated Content)。这些用户生成内容包含大量有用的情感信息,对于用户决策和企业的产品改进等有着重要的价值。因此,如何使用文本情感分类技术对海量的用户生成内容中的情感信息进行挖掘,已经成为学术界和产业界的一个热点问题。目前虽然基于机器学习的文本情感分类方法已经取得较好的结果,但是在实际应用中获取有标记样本需要消耗大量的人力,相反获取未标记样本却十分容易。因此,如何利用少量有标记样本和大量未标记样本进行文本情感分类已成为一个亟待解决的问题。为此本研究将半监督协同训练方法引入到文本情感分类方法当中,用于解决文本情感分类中未标记样本的利用问题。首先,本研究分析了文本情感分类和半监督学习的研究现状,明确了当前的研究问题和未来的研究方向。其次,本研究对文本情感分类和半监督学习的基础理论进行了系统研究,分析了文本情感分类的主要任务、文本情感分类的主要方法,以及半监督学习的基本假设、半监督学习的有效性和半监督学习的主要方法等基础理论。然后,以此为基础,本研究对基于半监督协同训练的文本情感分类方法进行了研究。考虑到当前已有研究还较少关注数据分布对文本情感分类的影响,本研究从数据分布是否均衡两个角度,分别构建了数据分布均衡条件下基于IDSSL的文本情感分类模型,以及在数据分布非均衡数据条件下基于混合策略的文本情感分类模型。最后,本研究将基于半监督协同训练的文本情感分类方法引入到实际应用中,通过选取电子商务和医疗社交媒体两个实际应用场景,分别对两类基于半监督协同训练的文本情感分类方法的有效性进行了检验。实验结果表明,本研究提出的方法在不同数据分布情况下均取得了较好的结果,从而验证了本研究提出方法的有效性。通过本研究,一方面将半监督学习方法引入到文本情感分类问题中,拓展了文本情感分类和半监督学习的基础理论,并以此为基础构建了基于半监督协同训练的文本情感分类模型。另一方面,将基于半监督协同训练的文本情感分类模型应用于具体实际问题中,拓展了文本情感分类和半监督学习的应用范围。
其他文献
20世纪90年代,连锁超市以一种高效率的商业运营模式出现在我国零售业市场,并使得零售业市场结构发生很大变化。制造商为了进入零售卖场,占有更有利的卖场空间,获得零售商更多
随着科技的快速发展,微型话筒、小型摄像机、可拍照手机等录音、摄像设备的不断普及,为人们生活带来极大方便。但录音过程中,由于各种原因,所录音频出现一定响度噪声的情况时
【正】 为了尽快改变“书荒”现象,国家出版局最近决定,从北京和上海有关出版社已经出版的文艺书笈中,选出三十多种为当前广大读者迫切需要的中外优秀作品,迅速重印一批,首先
目的研究综合性护理用于小儿重症肺炎并发呼吸衰竭的效果。方法选取2016年3月—2018年1月在本院ICU治疗的重症肺炎并发呼吸衰竭患儿104例,随机分为对照组和观察组,每组各52例
编码器是闭环伺服控制系统的位置反馈元件,对伺服系统中电机的控制性能有着重要的影响。磁编码器具有高响应性、抗震等级高、防油污等特点。然而其具有分辨率不高,要求充磁精
用圆杯倾出法试验考察微量硼变质处理和未变质处理ZCu Zn40Pb2凝固界面的组织形貌,研究微量硼对ZCu Zn40Pb2铸态组织和脱锌腐蚀性能的影响。结果表明,加入微量的硼可以明显地
为探究考虑层间接触效应的钢纤维混凝土隧道单层衬砌内力分布规律,自行设计考虑与不考虑层间效应的单层衬砌模型并研制竖向油压5MPa和侧向压力1.5MPa作为逐级施加的卧式加载
玉鹰,西周玉器。高5.4厘米,宽7.6厘米,厚0.4厘米,重21克。玉质为青色,因轻度侵蚀,略呈鸡骨白色。玉鹰体扁平,作停立状。长颈前伸,圆目,钩喙,曲背垂翅,羽尾下收。两面纹饰相同,皆以阴线刺
<正>文化是一个国家、一个民族的灵魂,能够在人们认识世界、改造世界的过程中创造生产力、提高竞争力、增强吸引力、形成凝聚力。乡村振兴,既要"塑形",更要"铸魂";既要有"颜
我国正面临着非常严峻的资源短缺和环境污染问题。在废旧产品回收市场上,废旧家电的回收和处理方式很不正规,大部分报废的家电产品没有得到规范的处理,带来了严重的资源浪费