中文微博细粒度情感判别研究

来源 :南华大学 | 被引量 : 3次 | 上传用户:wodeziyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为一种新型的社交网络平台,能随时随地发布简短且内容丰富的文本,这些信息有可能代表用户的观点或喜好,挖掘用户这些信息对舆情监控、市场营销、谣言控制等都有重要意义。目前,对文本的情感分析侧重于简单的积极、消极二值分类。由于微博文本存在口语化严重,数据稀疏等问题,因此对情感深层次的细粒度判别是十分重要且必要的。本文工作包括以下两个方面:(1)针对有明显情感词的微博,设计了一种基于情感元素模型的微博细粒度情感判别方法。根据依存句法,分析出句子中词语间的依存关系,找出副词、否定词等词语级情感影响因子,建立情感元素模型并计算分值,对每种粒度分别进行求和,将最大值所对应的细粒度作为微博的情感的策略。(2)针对无明显情感词的微博,设计了一种多特征支持向量机的微博细粒度情感判别的方法。首先,在特征选择阶段进行改进,针对传统卡方检验(CHI)特征选择不稳定性,只考虑微博条数而未考虑词频,提出一种卡方检验-词频逆文档词频(CHI-TFIDF)的特征抽取方法,将词频、逆文档词频引入到CHI算法中。实验表明改进的CHI算法相比传统CHI稳定性和有效性均有所提高。将上述得到的特征词再结合微博句子结构和语义等特征引入到支持向量机算法中,训练模型最终得到细粒度判别结果。将本文提出的方法与传统的机器学习算法支持向量机进行实验比较,准确率和F值均高于支持向量机的,原因在于对有多重情感倾向的微博使用情感元素模型判别方式判别更准确。2014年以本文提供的方法参加第三届自然语言处理与中文计算会议发布的中文微博情绪识别与分类评测任务,在五个队伍提交的七组结果中取得第二名好成绩。
其他文献
随着无人机技术的日益成熟,无人机被广泛运用在生活中的各个领域,如航拍、警用、电力、植保等。在农业植保应用中,因为无人机植保效率高,成本低,开始逐渐取代人工作业,市场潜
介绍了电梯交通配置的基本理论,提出了一种电梯交通配置流程,比较了使用仿真法与计算法进行电梯系统配置的差异。描述了电梯选型配置系统——LIFT Version 1.0主要模块的结构
我国注册会计师制度从八十年代恢复以来,在人员素质、机构、规模等方面都取得了快速发展。但是由于近些年审计失败案件的曝光,注册会计师的审计质量收到了广大社会公众的质疑
在中国国家乒乓球女子二队集训中,运动员循环赛成绩通常在两个月内采用分组循环对抗赛的形式分多个阶段产生,由于参训人数较多,增加了比赛编排和成绩计算的难度。系统运用面
本研究以《伤寒论》名方吴茱萸汤为研究对象,从吴茱萸汤的君臣佐使配伍关系出发,以君药吴茱萸为核心,进行拆方设计。对不同药味组成的各处方的水煎醇沉液进行药理实验和HPLC分析。选
课题以ZPG20盘式振动干燥机为原型,在对其底盘振动系统的静力学分析后,根据其结构动力学原理,运用有限元分析软件ANSYS进行结构动力学分析(模态分析、谐响应分析)。根据运动
在对标准潜在狄利克雷分布(LDA)模型进行改进的基础上,提出了一个主题情感混合最大熵LDA模型对在线评论进行细粒度观点挖掘.首先,在传统LDA模型中加入最大熵组件来区分背景词
<正>我们目前正经历一个品牌淘汰的过程,一些竞争力比较弱的品牌会慢慢被淘汰,货真价实的品牌会留下来。在一个市场上品牌一定是稀缺的,不可能太多,一方面可以自己创造,另一
木材资源的短缺使得高得率浆这种环境友好型制浆技术得到大力发展。高得率浆(HYP)具有高松厚度和高不透明度等独特优势;但是由于其自身含有大量木素,容易吸收紫外光,导致含有H
目的:对146例腕关节三角软骨损伤患者进行疗效分析。方法:按照急慢性损伤施以不同治疗措施,6周后进行Robbins腕关节评分。结果:146例患者优102例,良21例,可14例,差9例,总优良