基于词语相关度的微博新情感词自动识别

来源 :计算机应用 | 被引量 : 0次 | 上传用户:intercsw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对微博中新情感词的识别问题,提出了一种基于词语相关度的微博新情感词自动识别方法。首先,对于分词软件把一个新词错分成几个词的问题,利用组合思想将相邻词进行合并作为新词的候选词;其次,为了充分利用词语上下文的语义信息,采用神经网络训练语料获得候选新词的空间表示向量;最后,利用已有的情感词典作为指导,融合基于词表集合的关联度排序和最大关联度排序算法,在候选词上筛选,获得最终的情感新词。在COAE2014(第六届中文倾向性分析评测)任务3语料上,提出的融合算法与点互信息(PMI)、增强互信息(EMI)、多词表达距离(MED)、新词语概率(NWP)以及基于词向量的新词识别方法相比,准确率至少提高了22%,说明该方法自动识别微博新情感词效果优于其他五种方法。
其他文献
目的:探讨10种广东本地清热解毒中草药的抗细菌内毒素作用。方法:采用鲎试剂试管凝集反应进行体外抗内毒素实验。结果:所研究的10种广东本地清热解毒中草药,药液浓度为1.0g/m
伺服机构作为光电系统点源目标模拟器的部件,为点源的目标大小、辐射强度、运动轨迹提供精确控制。为提高目标模拟器动态响应和系统的实时性,提出了基于RTX的实时伺服控制系
论述了焦炉煤气中氰化物含量的常见分析方法,借鉴了水中氰化物的分析方法,利用硝酸银滴定法对焦炉煤气中氰化物含量进行了分析,该方法具有操作简单、节约分析时间、毒性小等
现阶段,分析化学教学中存在着师生互动性差、学生学习兴趣不高等问题,已严重影响其教学效果。微课作为一种新型的教育信息资源,在教学中引起了广泛的关注,并取得了较好的教学
为了方便有效地对PD雷达进行干扰抗干扰技术研究,需要利用某种计算机仿真技术,建立一套仿真系统,最大程度地模拟PD雷达干扰环境。基于此目的,文章首先描述了PD雷达发射信号的
针对传统螺旋锥齿轮三维实体造型方法的不足,分析了螺旋锥齿轮铣齿加工的基本原理以及Phoenix Ⅱ数控螺旋锥齿轮铣齿机加工运动的数学模型。以AutoCAD为开发平台,利用AutoCAD
<正>语文学科的复习备考存在以下规律:一是语文课程的开放性、灵活性,决定了复习内容的广泛性;二是语文试题的题型特点决定了复习模式的多样性;三是语文本质的生活化决定了复
会议
我国的法律制度与英、美等国的法律制度不同 ,适用刑罚并非遏制环境污染和破坏行为的最佳途径。在环境刑法中适用严格责任原则势必影响我国的经济建设。诉讼的根本价值在于追
<正>习近平总书记在十九大报告中指出,党的基层组织是确保党的路线方针政策和决策部署贯彻落实的基础。要以提升组织力为重点,突出政治功能,把企业、农村、机关、学校、科研