论文部分内容阅读
互联网技术的进步推动我国电子商务产业实现了跨越式的发展,电子商务平台的种类和规模剧增。电子商务产业的快速发展极大改变了人们的生活方式。现如今,网购已经成为消费者不可替代的消费方式,人们也热衷于通过线上购物的方式去挑选自己心仪的产品。而产品在线评论作为消费者网购后撰写发表的关于产品的主观评价现已成为电子商务平台的重要数据资产,这些数据为电子商务平台、消费者、商家都提供了巨大的潜在应用价值。
尤其对消费者而言,产品在线评论是他们做出网购决策重要的参考依据之一。但是,如何对纷繁杂乱的海量在线评论数据进行高效整合利用,形成对产品客观的评价和认识,进而帮助消费者做出合理的购买决策是一个值得研究并蕴含丰富应用价值的问题,本文针对这个问题主要开展了如下工作:
首先,在国内外基于在线评论的产品属性提取及权重确定、产品在线评论的情感分析和基于在线评论的产品多属性综合评价模型等文献研究基础上,总结出现有研究的成果与不足,确立了本文的主要研究内容,并且针对本文的研究问题给出了总体研究框架。
其次,采用Pkuseg中文分词工具对预处理后的产品在线评论数据进行分词和词性标注处理,建立产品在线评论的语料库。在此基础上,基于关联规则Apriori算法对语料库进行产品属性提取,得到产品候选属性集合,再通过适当地人工整理、归类确定最终的产品属性集合。然后,基于词频统计的方法对产品属性集合中的属性词进行词频统计,计算出各属性对应的权重。
接着,构建情感词典,判断情感词极性,并分析程度词和否定词对情感词产生的修饰作用,然后对所有的产品在线评论开展情感分析,量化计算产品在线评论中消费者关于产品属性的情感倾向。在此基础上,构建一个新的融合情感分析和概率语言TOPSIS方法的产品多属性综合评价模型,并对新模型的可行性进行验证分析,结果表明新的模型是可行的、有效的。
最后,基于本文提出的新产品多属性综合评价模型开展算例分析。首先,将备选产品在线评论中消费者关于属性的情感倾向进行量化计算,得到消费者关于属性的情感倾向等级及其概率分布,并进一步将得到的情感倾向等级及其概率分布转化表示为可以进行产品多属性综合评价的初始概率语言评价信息,通过概率语言TOPSIS方法最终计算出备选产品的综合评价值,给出备选产品的排序。通过算例分析进一步说明了本文提出的融合情感分析和概率语言TOPSIS方法的产品多属性综合评价模型的有效性和可操作性。
尤其对消费者而言,产品在线评论是他们做出网购决策重要的参考依据之一。但是,如何对纷繁杂乱的海量在线评论数据进行高效整合利用,形成对产品客观的评价和认识,进而帮助消费者做出合理的购买决策是一个值得研究并蕴含丰富应用价值的问题,本文针对这个问题主要开展了如下工作:
首先,在国内外基于在线评论的产品属性提取及权重确定、产品在线评论的情感分析和基于在线评论的产品多属性综合评价模型等文献研究基础上,总结出现有研究的成果与不足,确立了本文的主要研究内容,并且针对本文的研究问题给出了总体研究框架。
其次,采用Pkuseg中文分词工具对预处理后的产品在线评论数据进行分词和词性标注处理,建立产品在线评论的语料库。在此基础上,基于关联规则Apriori算法对语料库进行产品属性提取,得到产品候选属性集合,再通过适当地人工整理、归类确定最终的产品属性集合。然后,基于词频统计的方法对产品属性集合中的属性词进行词频统计,计算出各属性对应的权重。
接着,构建情感词典,判断情感词极性,并分析程度词和否定词对情感词产生的修饰作用,然后对所有的产品在线评论开展情感分析,量化计算产品在线评论中消费者关于产品属性的情感倾向。在此基础上,构建一个新的融合情感分析和概率语言TOPSIS方法的产品多属性综合评价模型,并对新模型的可行性进行验证分析,结果表明新的模型是可行的、有效的。
最后,基于本文提出的新产品多属性综合评价模型开展算例分析。首先,将备选产品在线评论中消费者关于属性的情感倾向进行量化计算,得到消费者关于属性的情感倾向等级及其概率分布,并进一步将得到的情感倾向等级及其概率分布转化表示为可以进行产品多属性综合评价的初始概率语言评价信息,通过概率语言TOPSIS方法最终计算出备选产品的综合评价值,给出备选产品的排序。通过算例分析进一步说明了本文提出的融合情感分析和概率语言TOPSIS方法的产品多属性综合评价模型的有效性和可操作性。