论文部分内容阅读
随着Web2.0发展,用户成为网络内容的主创者,每天都有海量数据生成,其中包含大量新词.因此,本文提出一种基于词语相关度的微博新情感词自动识别方法.由于分词软件常把一个新词错分成几个词,我们利用组合思想将相邻词进行捆绑作为新词的候选词.为了充分利用词语上下文的语义信息,采用神经网络训练语料获得候选新词的空间表示向量.随后,利用已有的情感词典作为指导,融合基于词表的候选词关联度排序和最大关联度排序算法,在候选词上筛选,获得最终的情感新词.通过在COAE2014任务3语料上进行实验,结果表明本文提出算法取得了比较好的结果.