基于情感时序距离的文本情感分类和情感主体识别方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zy07021023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感文本的分析工作主要就是挖掘出用户表达在文本中的情感,分析用户的意见态度。本文在对社交网络上的评价文本展开了研究工作,尤其是对于情感表达不单一或者不明显的情感文本,提出了基于情感时序距离和转折同化的文本情感分类方法,然后又在此基础上对用户的情感做出了较为细致的修饰对象识别。主要的研究如下:(1)将中文评价体系中的文本情感与情感事件发生的顺序相互结合,同时构建并且扩展其中的词典信息,将单条情感句量化成特征向量,之后使用SVM构造分类器函数,以获取每条与情感相关的语句的极性信息,将整个情感文本转化成按照时间顺序排列的情感节点序列,每个节点代表了每条情感句的极性。将情感文本转化成情感时序序列之后,我们又在整个文本结构考虑了转折语义的关系,提出了转折同化的概念,将转折语义应用在了文本结构层次。最终通过计算每个情感节点的加权情感之和,得到的最终情感值就做为情感整个文本的情感倾向性,而加权的依据就是情感节点在情感时序中出现的顺序,越是靠近情感文本最后的节点,对于文本最终的情感倾向具有越大的影响力。(2)用户在一条评价文本中表达的态度可能是多方面的,而不是单一的某一方面,不同的方面表达的意见可能不同,因此识别出每条情感剧的情感主体就变得很有必要。我们首先根据句子中的语义信息量将文本中的评价句分为非语义评价句和语义评价句。对于语义评价句,因为其包含丰富的语义倾向,我们利用Word2vec将句子中每个词转换成语义向量形式,然后通过将句子中所有的词向量进行加权矢量求和,得出整个语义评价句的语义特征形式。然后利用随机森林算法对语义评价句进行情感主体分类,在本文提供的数据集中主要是三个方面的情感主体。在得出语义评价句的情感主体后,利用我们制定的规则,对非语义评价句进行情感主体的分类。最终保证所有的评价句的情感修饰主体都被识别出,那么其中包含的情感句的情感主体也就是被识别出了。最后我们在从某购物网站爬取的评价数据集上,将本文方法与不同的文本情感分析方法进行对比分析,实验结果表明本文提出的方法提高了情感文本分类的结果,验证了方法的有效性。
其他文献
本文介绍了典型国家公立医院按绩效补偿的经验:设定绩效目标,加强财政补助支出预算执行监控与评价,以产出为基础,按承担任务多少为公立医院安排财政拨款。分析了我国公立医院
大明山国家自然保护区是1996年世界自然基金会认定的中国40处具全球意义的自然保护区之一。本文通过对保护区信息化建设现状的描述,引发保护区对未来的规划。
隐喻是现代许多人文科学研究的一个重要主题。隐喻作为一种语言现象,是对两个语词意义的直接认同;作为一种文化现象,是说话者在一定的文化背景下对内在精神世界的独特表达。外国
<正>在一次中学教师和中国科学院院士的座谈会上,一位中学教师说:"很多诺贝尔奖获得者在很年轻的时候就开始走上科学研究之路,想到这些,我们就感到紧迫和压力。"
期刊
该文是一篇近两个月的锂电池文献评述,以"lithium"和"batter*"为关键词检索了Web of Science从2018年2月1日至2018年3月31日上线的锂电池研究论文,共有2731篇,选择其中100篇
本文拟对蝇蛆壳聚糖对实验性糖尿病大鼠血糖相关指标的改善作用及其相关作用机制进行探讨。对正常大鼠及糖尿病模型大鼠进行蝇蛆壳聚糖干预30d,测定各实验组干预前后血糖(blo
目的探讨阿托伐他汀对急性脑梗死患者的临床疗效、安全性及患者的早期预后,并研究阿托伐他汀的调脂作用与ABCA1基因R219K多态性之间的关系,分析不同ABCA1基因型对阿托伐他汀
目的探讨急性期的血脂水平(甘油三酯、胆固醇)是否为缺血性脑卒中预后的独立危险因子。资料与方法1、收集2007年1月1日至2010年6月30日期间,在宁夏医科大学附属医院神经内科
本文通过分析实务中企业合并时资产评估增值在合并报表层面的账务处理过程,对由此在合并报表层面产生的递延所得税展开分析。
以硝酸铋(Bi(NO3)3&#183;5H2O)和偏钒酸铵(NH。VOs)为原料,十六烷基三甲基溴化铵(CTMAB)为软模板剂,硝酸铜(Cu(NO3)2&#183;3H2O)为Cu源,改性粉煤灰作为载体,通过水热合成法在不同pH值条件下制