【摘 要】
:
针对微博中新情感词的识别问题,提出了一种基于词语相关度的微博新情感词自动识别方法。首先,对于分词软件把一个新词错分成几个词的问题,利用组合思想将相邻词进行合并作为
【机 构】
:
山西大学计算机与信息技术学院,计算智能与中文信息处理教育部重点实验室山西大学
【基金项目】
:
国家863计划项目(2015AA015407);国家自然科学基金资助项目(61175067,61272095,61432011,61573231,U1435212);山西省科技基础条件平台计划项目(2015091001-0102);山西省回国留学人员科研项目(2013-014)~~
论文部分内容阅读
针对微博中新情感词的识别问题,提出了一种基于词语相关度的微博新情感词自动识别方法。首先,对于分词软件把一个新词错分成几个词的问题,利用组合思想将相邻词进行合并作为新词的候选词;其次,为了充分利用词语上下文的语义信息,采用神经网络训练语料获得候选新词的空间表示向量;最后,利用已有的情感词典作为指导,融合基于词表集合的关联度排序和最大关联度排序算法,在候选词上筛选,获得最终的情感新词。在COAE2014(第六届中文倾向性分析评测)任务3语料上,提出的融合算法与点互信息(PMI)、增强互信息(EMI)、多词表达距离(MED)、新词语概率(NWP)以及基于词向量的新词识别方法相比,准确率至少提高了22%,说明该方法自动识别微博新情感词效果优于其他五种方法。
其他文献
目的:探讨10种广东本地清热解毒中草药的抗细菌内毒素作用。方法:采用鲎试剂试管凝集反应进行体外抗内毒素实验。结果:所研究的10种广东本地清热解毒中草药,药液浓度为1.0g/m
伺服机构作为光电系统点源目标模拟器的部件,为点源的目标大小、辐射强度、运动轨迹提供精确控制。为提高目标模拟器动态响应和系统的实时性,提出了基于RTX的实时伺服控制系
论述了焦炉煤气中氰化物含量的常见分析方法,借鉴了水中氰化物的分析方法,利用硝酸银滴定法对焦炉煤气中氰化物含量进行了分析,该方法具有操作简单、节约分析时间、毒性小等
现阶段,分析化学教学中存在着师生互动性差、学生学习兴趣不高等问题,已严重影响其教学效果。微课作为一种新型的教育信息资源,在教学中引起了广泛的关注,并取得了较好的教学
为了方便有效地对PD雷达进行干扰抗干扰技术研究,需要利用某种计算机仿真技术,建立一套仿真系统,最大程度地模拟PD雷达干扰环境。基于此目的,文章首先描述了PD雷达发射信号的
针对传统螺旋锥齿轮三维实体造型方法的不足,分析了螺旋锥齿轮铣齿加工的基本原理以及Phoenix Ⅱ数控螺旋锥齿轮铣齿机加工运动的数学模型。以AutoCAD为开发平台,利用AutoCAD
<正>语文学科的复习备考存在以下规律:一是语文课程的开放性、灵活性,决定了复习内容的广泛性;二是语文试题的题型特点决定了复习模式的多样性;三是语文本质的生活化决定了复
我国的法律制度与英、美等国的法律制度不同 ,适用刑罚并非遏制环境污染和破坏行为的最佳途径。在环境刑法中适用严格责任原则势必影响我国的经济建设。诉讼的根本价值在于追
<正>习近平总书记在十九大报告中指出,党的基层组织是确保党的路线方针政策和决策部署贯彻落实的基础。要以提升组织力为重点,突出政治功能,把企业、农村、机关、学校、科研