论文部分内容阅读
电子商务的迅速发展使得越来越多的用户喜欢在网上购买商品,用户在购买商品时通常喜欢参考别的用户对该商品的评论,来判断该商品是否适合自己。目前很多电子商务网站都有商品总体情感倾向的分析,但是用户在购买商品时通常喜欢根据自己感兴趣的属性判断某件商品是否适合自己。论文以商品的评论文本为研究对象,研究了构造基于属性的商品评论挖掘系统所需要的工作和关键技术,包括评论文本预处理、商品属性提取与关联、属性级的情感倾向性分析与结果展示。探讨了使用词典与统计相结合的算法对评论文本分词,使用维特比算法查找隐马尔科夫模型最优路径的方法对分词后的评论文本进行词性标注。实验结果表明改进后的分词算法能取得较高的性能,使用学习后的词典相比学习前的词典能取得更高的查准率。使用改进的关联规则算法和相应的三种剪枝规则来提取商品的频繁属性,关联属性词与观点词,来提高处理速度。实验结果表明改进后的关联规则算法执行速度比未改进的快。设计基于属性的评论情感分析和评级方法,将情感按照正负向和强弱程度分为五个级别,并通过实验结果验证该算法的可行性并计算准确率。