人物评价文本情感分析研究

来源 :苏州大学 | 被引量 : 2次 | 上传用户:willa81
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析以主观性文本为研究对象,对之进行标注、识别、分类、聚类和抽取等操作,以达到有效判断、提取、汇总这些文本中蕴含的情感和观点的目的。文本情感分析目前主要的研究内容包括:情感文本语料库建设、主客观分类、评价极性分析、评价对象抽取、文本情感摘要和文本情感汇总等。随着移动互联网应用的普及,舆情分析、产品评价分析等应用必将发挥更广泛和重要的作用,而这些应用都是以文本情感分析研究为基础的。尽管文本情感分析的研究已经取得了一定成绩,但与实际应用的需求还有很大差距。尤其在人物评价文本情感分析方面,相关的研究非常缺乏。与研究较多的产品评价文本相比,人物评价文本所包含的情感表达有其独特的特性,不能将以往的研究直接用于人物评价文本的情感分析中。针对人物评价文本,本文利用机器学习和数据挖掘方法,开展了情感分析的研究,主要工作包括以下三方面:首先,本文设计了一个基于多分类器融合和主动学习方法的人物评价语料库构建方案,并获得了人物正负评价语料库及脏话语料库。在少量人工标注语料的基础上,利用保守投票的多分类器融合规则,逐步扩充一个带正负类别标签的人物评价语料库。该语料库是针对人物评价本文情感分析的研究基础。特别值得注意的是,针对人物评价文本中广泛存在的脏话现象,在人工收集并标注少量脏话句子的基础上,使用主动学习的方法,多次迭代形成了一个高质量的脏话文本语料库。实验结果表明,基于此语料库构建的识别脏话方法,能够提高负面评价识别的准确率和查全率。其次,本文提出了一个基于知识库和搜索引擎的两层架构人物分类方法。情感分析存在领域依赖问题,针对不同类型人物的评价文本的遣词造句有较大差距。因此,针对人物评价的情感分析研究迫切需要对人物的类型进行划分。针对该问题,本文提出了一个基于知识库和搜索引擎的两层架构人物分类方法。利用知识库进行人物分类,对无法在知识库中检索到的人物利用搜索引擎返回的新闻文本进行人物分类。针对搜索引擎可能反馈噪声新闻的情况,设计了一个基于主题模型的有效新闻提取算法。实验结果表明,本文提出的方法能够有效的对人物类型进行分类。最后,本文提出了一种基于二分图最大权完全匹配的评价要素抽取方法。基于评价对象和评价词在文本中的修饰与约束关系,本文提出了一个基于二分图的评价对象和评价词抽取方法,把评价对象和评价词作为二分图的两个顶点集合;在此基础上,设计了一个集合词性和句子关系的句子级PMI计算方法用于句子在二分图中的权重计算方法。该方法的优势在于计算出的PMI值能够精细刻画评价对象与评价词之间的联系;然后,利用匈牙利和Kuhn-Munkras算法求出二分图的最大权完全匹配,对结果进行筛选,从而得到评价对象和评价词二元组。实验结果表明本文提出的评价要素抽取方法能够有效提高抽取的正确率和召回率。最后本文综合上述技术,通过实验成功挖掘出了针对不同类别人物评价文本中的主要评价对象以及常用评价词,汇总出了正面和负面评价的评价对象的不同侧重点。总体而言,本文的主要贡献在于对于人物评价分析的关键问题进行了深入研究。主要在人物评价情感分析语料库、人物类型分类方法、评价对象和评价词抽取方法提出了新方法。这些方法对于情感分析其他领域领域同样具有很好的参考价值。
其他文献
当前,我国传统的家庭结构逐渐变化,大多数婚后子女与父母分开居住,加之众多年轻人离开家乡工作,所以空巢老人越来越多。同时,随着人口老龄化的加剧,越来越多的老人在身体上和
南水北调工程投资巨大,项目偿债政策关系工程运营风险和项目可持续运行。依据南水北调东线一期工程运行初期水价制度,分析南水北调东线山东段项目法人2013-2020年偿债能力情
手术并发症是医院所面对的主要医疗风险,而其防控则是医院风险防控的重点内容。文章从适当履行注意义务和说明义务的角度,探讨手术并发症的法律风险点,并从医疗行政和医疗安
哥特小说自诞生之日起经历约60年的探索发展,终由于传统模式和消费控制的影响一度使其逐渐走向衰亡,哥特小说与恐怖小说、灵异小说的区别也变的模糊不清,而且大有被取代之势
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:从医学生的视角探讨医患关系及其影响,找寻改善医患关系的良方,并为医学生的培养提出建议。方法:采取问卷调查方法,对西南医科大学在校各年级医学生进行问卷调查,同时对非
--在数字取证近十年来的研究和发展过程当中,其研究所覆盖的范围和对现代社会带来的影响都在飞速增长。随着越来越多事物被数字化,人们身边充斥着各种各样的数字设备。这些数
互联网+时代下对高校思想政治教育方式方法提出了新的挑战,适应这一时代要求创新高校思政教育已经迫在眉睫。文章就是在这样一个背景下,从互联网+时代涵义及研究的意义谈起,
针对某板料折弯机卸荷回路中阻尼孔直径选取不当时,溢流阀发出噪声的现象进行研究。根据该板料折弯机卸荷回路的原理,建立了卸荷回路数学模型,在此基础上采用AMESim软件建立
根据先导式溢流阀的原理,对其进行了抽象和简化,并在AMESim HCD库中建立了先导式溢流阀的仿真模型。针对先导式溢流阀传统设计方法中存在的问题,提出了一种先导式溢流阀参数