论文部分内容阅读
在垃圾评论问题日益严重的今天,本文主要对产品的评论识别进行研究。在分词技术上,对逆向最大匹配算法进行改进,将中性高频词及无用词先行在句子中剔除,减少循环次数,提高运算效率。重新设置词语权重,在相似度定义中加入平滑因子,从而可以识别近义词。从实验结果可以看出,这种新的识别技术在很大程度上提高了对于产品评论识别的准确率和召回率。