Web评论文本情感分类方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：shewe111

【摘要】

：

随着电子商务及社会媒体的快速发展,用户越来越习惯于在互联网上针对商品、新闻事件、公众人物等各种对象及主题发表评论。面对不断涌现的海量Web评论文本,传统的人工方式难

【作者】

：

张璞

【出处】

：

重庆大学

【发表日期】

：

2015年期

【关键词】

：

情感分类特征扩展半监督学习自训练协同训练

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着电子商务及社会媒体的快速发展,用户越来越习惯于在互联网上针对商品、新闻事件、公众人物等各种对象及主题发表评论。面对不断涌现的海量Web评论文本,传统的人工方式难以对其中的观点信息进行全面有效的分析利用,因此,近年来文本情感分析研究得到了广泛关注。作为文本情感分析中的一项核心任务,文本情感分类旨在对带有情感色彩的文本进行情感倾向性分类,具有重要的学术研究价值及广泛的应用前景,同时也面临诸多挑战性问题。本文围绕文本情感分类研究所面临的数据稀疏性、标注样本获取困难、情感资源的不平衡性等问题,开展了一系列研究。主要工作及贡献包括以下几点:①提出了基于特征扩展与集成学习的句子级情感分类方法。针对句子级评论文本中的数据稀疏性问题,本文在大规模无标注数据集上训练主题模型和词向量表示模型。通过主题模型来获得主题特征,通过词向量表示模型来获得相关词特征。然后分别利用这两种特征来对文本进行特征扩展,并相应训练分类器。在此基础上,本文进一步利用集成学习方法将不同分类器的分类结果进行集成,得到最终分类器。实验结果表明:基于特征扩展与集成学习的情感分类方法中,主题特征及相关词特征均能有效地对文本进行特征扩展,缓解数据稀疏性问题。最终分类器由于集成了两类不同分类器的分类结果,能综合利用主题特征及相关词特征的语义信息,进一步提升分类性能。②提出了基于情感词典与机器学习的无监督情感分类框架。针对有监督情感分类方法中标注样本获取困难的问题,本文提出一种不依赖于人工标注语料的无监督情感分类框架。该框架分两阶段来进行情感分类:第一阶段利用情感词典资源从无标注语料中挑选置信度高的样本来构成伪标注训练集;第二阶段则使用半监督学习方法,利用伪标注训练集及无标注数据来学习分类器,获得分类结果。在四个公共数据集上的实验结果表明:无监督情感分类框架通过对情感词典及语料的有效应用,能够有效改善分类性能;进一步,本文还比较了各种半监督学习算法在分类框架中的分类效果,发现自训练方法具有分类性能好、适应性强等特点,适用于该情感分类框架。③提出了基于数据集划分与自训练的无监督文档情感分类方法。在第②项研究工作的基础上,针对自训练法在迭代过程中所累积的样本噪声导致分类性能下降的问题,本文提出一种基于数据集划分的改进自训练法。该方法在数据子集上学习分类器,并在迭代过程中由两个分类器对无标注样本的分类结果进行一致性检验。在四个公共数据集上的实验结果表明:基于改进自训练分类器的无监督情感分类方法能有效地降低错误标记样本带来的影响,相比其他一系列基准方法有显著的性能提升,在部分数据集上的分类性能甚至超出了有监督学习方法的分类性能。④提出了基于随机子空间与协同训练的跨语言情感分类方法。针对情感资源的不平衡性问题,本文研究跨语言情感分类问题,以充分利用不同语言的资源。在利用语言学知识的基础上,提出了一种基于词性组合的随机子空间法,并将其应用于中文及英文这两种语言视图上,然后将得到的多个子视图应用于协同训练方法中来进行跨语言情感分类。实验结果表明:将基于词性组合的随机子空间法应用于协同训练框架中,由于得到更多冗余视图,能有效地利用不同语言中的标注语料及无标注语料,从而显著地提升跨语言情感分类性能。

其他文献

CSSD采用洗衣机清洗复用止血带的效果观察

目的比较全自动清洗消毒机与家用洗衣机清洗复用止血带的清洗效果。方法将临床科室使用后的800根污染止血带随机分为两组,对照组用全自动清洗消毒机清洗,观察组用家用洗衣机

期刊

止血带洗衣机清洗方法效果观察

漂浮放松反馈训练太空舱在军事飞行人员心理应激防护中的应用效果

目的探讨漂浮放松反馈训练太空舱对军事飞行人员心理应激防护的效果,为后续的应用和研究提供参考。方法以46名军事飞行人员为研究对象,随机分为试验组(n=26)和对照组(n=20)。

期刊

漂浮反馈训练心理应激军事飞行人员

岗藿抗感汤联合达菲治疗病毒性肺炎的临床疗效观察

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

岗藿抗感汤病毒性肺炎奥司他韦岗梅根藿香羌活银翘散

大型测试仪器在高分子本科实验教学中的应用初探

目前,高分子科学实验课普遍存在各实验项目相对独立、内在联系相对较弱的局限,不利于学生对材料研究内容与方法的整体认识与把握。我们在原有高分子实验课程的基础上,引入大

期刊

大型仪器高分子材料专业实验教学large instrumentspolymer materialexperimental teaching reform

腕管综合征非手术疗法的康复效果

目的:观察非手术疗法对腕管综合征(CTS)的康复效果.方法:63例CTS患者随机分为常规组31例(41只手)和观察组32例(39只手),均按常规方法治疗.观察组同时增加温热疗法、电脑中频

期刊

非手术疗法腕管综合征功能评定

中小学书法教育的学科规范与课程定位

中国书法是中华民族的文化瑰宝，是人类文明的财富。中小学书法教育是在原有语文课程中书写训练的基础上独立出来的一门课程，在义务教育阶段对书法的学习具有极其重要的意义。书

期刊

中小学书法教育学科规范课程地位

十余年来发生的空难事故

1989年2月8日,美国独立航空公司的一架波音707飞机在亚速尔群岛的圣玛丽亚岛坠毁后爆炸起火,145人死亡.1991年5月26日,奥地利劳德航空公司的一架波音767客机在泰国曼谷北部热

期刊

空难事故亚速尔群岛爆炸起火航空公司玛丽亚

连续性血液滤过治疗顽固性心力衰竭合并肾功能不全30例疗效研究

目的：探讨连续性静脉-静脉血液滤过（CVVH）治疗顽固性心力衰竭（RHF）合并肾功能不全患者的疗效及安全性。方法：应用CVVH对30例RHF合并肾功能不全患者进行治疗，观察治疗前后生命体征、

期刊

连续性静脉-静脉血液滤过顽固性心力衰竭

硒酵母功能作用研究进展

硒是人和动物生存所必需微量元素之一,具有提高机体免疫力、清除体内自由基、抑制脂质过氧化反应等生物学功能。硒酵母作为一种营养添加剂适量加入食品、保健品和饲料中,广泛

期刊

硒酵母生产功能作用食品保健品饲料

青海本地马、骡八项血清生化指标测定

青海本地马主要有大通马、河曲马和柴达木马三种,其中大通马分布较为广泛,其中心产区在大通河流域的门源县,祁连县一带,属挽乘兼用型马种,具有耐粗饲、恋膘、抗病力强、繁殖

期刊

生化指标钙含量

Web评论文本情感分类方法研究

与本文相关的学术论文