论文部分内容阅读
基准词是具有明确褒贬义倾向的词汇,基准词的选择对词汇倾向性判别的准确率有影响。现有的基准词选择方法主要关注的是基准词的频率、类别区分度和上下文敏感性,忽略了基准词的褒贬强度,这导致了词汇乃至更大粒度的语言单元的语义信息遗失。本文提出了一种含强度的基准词选择和词汇倾向性判别方法,首先对情感词进行语义相似性计算和聚类,然后进行倾向性计算和分类,由此得到包含语义及强度信息的基准词集,该基准词集可用于词汇褒贬性及褒贬强度的判别。我们分别使用通用搜索引擎和领域搜索引擎对该方法进行了验证,实验结果表明,领域搜索引擎下