论文部分内容阅读
随着电子商务不断地发展,网上购物成为了越来越热门的事情。在琳琅满目的商品中挑选出称心如意的商品变得越来越困难。虽然许多网上商店都提供了商品的评价信息,但却没有对评价信息进行分类与分析等进一步的处理,没有从大量的评价信息中挖掘出更有价值的知识。本文针对上述问题,并具体针对手机方面的产品评论信息进行分析与挖掘,提出了一种手机评论信息挖掘系统,能够给商家以及消费者带来更具参考价值的信息。本文主要对手机评论信息挖掘系统进行了以下方面的分析与研究:首先,文本预处理。在预处理阶段,为了提高文本分类的准确率,本文剔除了文本中存在的无意义的词,并对剩下的词进行了分词处理。其次,建立词库集。为了将评论信息进行分类以及提高分类的准确性,本文建立了产品特征语料库,结合知网的情感词典,对情感词典的极性词赋予了权重,并且通过TF~*IDF对特征词进行了加权处理。通过运用朴素贝叶斯算法对评论信息进行分类,将评论信息分成好与差两类,同时进一步将相关产品的特征评论信息进行细化分类。本文通过对挖掘系统的实验结果进行分析,实验表明,本文提出的产品评论信息挖掘系统能够获得较高的准确率以及查全率,同时也说明了本文提出的手机评论信息挖掘系统的合理性与有效性。