基于弱监督的短文本情感分类方法研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:sunplusit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是对文本中关于某个实体情感态度的计算研究,情感分类是其中的主要研究领域。传统的情感分类方法方法多依赖人工设计的特征,而当前较流行的深度学习方法可自动提取文本特征,在解决短文本情感分类问题上表现优异。深度学习方法需提供足够多的监督数据方能训练出好的模型。然而监督数据需要大量人工标注,不易获取。为解决这一问题,提出了使用大规模弱监督数据训练深度学习情感分类模型的方法,并通过实验证明模型的有效性以及使用弱监督数据在一定程度上替代监督数据训练深度学习模型的可行性。具体工作如下:1.提出了基于弱监督的CNN-BiGRU模型的短文本情感分类方法。使用互联网上带有评分数据的评论信息作为大规模弱监督训练数据集,建立了CNN-BiGRU深度学习模型,并采用“弱监督预训练-监督微调整”策略训练模型。实验证明弱监督数据可以在监督数据缺乏时作为一种有效的替代,并验证了CNN-BiGRU模型和“弱监督-微调整”策略的有效性。2.为进一步降低弱监督数据中噪声对深度学习模型的影响,不直接使用弱监督数据训练目标预测函数,而是采用三元组损失函数预训练模型,防止深度学习模型过度拟合噪声。并尝试使用ConvLSTM作为新的深度学习模型,实验证明在预训练阶段采用三元组损失函数能有效提高模型效果。
其他文献
设立“宣传德清新闻奖”是我县为鼓励对外新闻报道而采取的一个措施。经过近两年的实践证明,它在提高德清的知名度,扩大对外宣传方面具有不可忽视的重要作用。 1993年底,随着
鸣沙山·月牙泉在1997中国旅游年,敦煌是你不能不去的地方。敦煌是古丝绸之路上的重镇,又是全国著名的旅游城市,那里的敦煌艺术、丝路风情、瀚海奇观别开生面,引人入胜。
退耕还林是一件非常重要的事情,是今后几年我省林业建设中最主要的工作.刘泽民副书记讲,退耕还林是我省农村发展中一项伟大的事业.范堆相副省长在刚刚召开的省政府会议上也对
目的低氧可以促进神经干细胞的增殖,但目前对于这种增殖机制还不十分清楚,鉴于自噬在代谢稳态上的调节作用,本研究拟探讨自噬是否能参与低氧对神经干细胞增殖的调节,进而从代
<正>政法干警在打击犯罪、保护人民、维护社会稳定方面发挥着极为重要的作用,这客观上要求政法干警不仅要有较强的业务能力,而且必须具有较强原则性、纪律性以及较强的法律意
会议
随着我国人民生活水平的不断提高,脑血管的发病率呈逐年上升的趋势,且发病急骤,病情危重.因此,病情变化密切观察和及时有效的救护,是降低病死率和致残率的关键.现将我院1999
应用免疫组化S-P法染色检测60例上皮性卵巢癌、15例交界性卵巢肿瘤、304例上皮性良性卵巢肿瘤、10例正常卵巢组织的石蜡切片中Krtipple样因子10(KLF10)及母系DPP同源物(Smad7)的
人们常说投其所好,就是要拿出其他人感兴趣的事物来交朋友,从某种角度上反映出了兴趣的作用。当然在每个人的学习生活中也是非常有必要寻找自己的“所好”,投中自己的“所好
“鼓励企业开展个性化定制、柔性化生产,培育精益求精的工匠精神,增品种、提品质、创品牌。”工匠精神第一次被写进政府工作报告,成为今年两会的一大亮点。
1典型病例李某,女,60岁,以“右膝关节内侧疼痛,行走困难7天”为主诉就诊,经拍片及体检诊断为“有膝关节内侧副韧带损伤”。予以针刺,按摩治疗。针刺后,患者自觉症状不减,又予以按摩,先