论文部分内容阅读
随着科学技术及信息技术的不断进步,电子商务的应用程度越来越高,Web2.0技术的进步在很大程度上对人们的物质生活和价值观念等都产生了非常大的影响,特别是在电子商务和大数据、海量数据的大背景下,网络购物、网络消费、网络交换等新技术新方法使更多的人感受到了电子商务带来的便利性和快捷性,对人们的生产生活产生了不可估量的巨大影响,然而也正是由于随着大数据和海量数据的到来,纷繁复杂的产品无所不有,更让人应接不暇,客户或消费者如何选择满意且更具有性价比的产品,成为人们越来越关注的焦点,因而通过对产品评论挖掘的研究从中获得更具价值的信息,变得越来越重要。在电子商务越来越普及的条件下,对于不同的产品或同一种产品,客户或购物者或消费者选择时对于产品的评价信息越来越重视。评论挖掘技术属于数据挖掘研究的重要方面,伴随着机器学习、信息检索、统计自然语言处理、数据挖掘等技术的发展,评论挖掘也成了目前研究的重点之一,并有许多研究成果己被广泛应用于社会实践中。本文主要是针对电子商务下酒店评论提出的一种广泛应用于众多产品评论挖掘的方法。众所周知,产品评论的信息主要是反应客户或消费者对产品在某种程度上的满意度,从而对商家的产品有更准确的定位,更方便人们对产品的认知。因此,产品评论挖掘主要是从客户的角度考虑,提取出简短而更具说服性的评论信息,使客户选择产品时,能对产品的质量、服务、整体的效果等多方面有更充分的了解,作为选择产品时的参考依据。通过对产品评论挖掘关键技术的研究,本文提出的评论挖掘方法主要涉及到以下几个部分,首先,需要从互联网中获取大量的有价值评论并对其加工处理;其次,对处理后的评论进行关键字或短语抽取,抽取的内容尽量保证原有的语义;再次,通过聚类或分类算法对评论中的不同属性进行相关内容的划分;最后,根据构建情感词库、否定词词库及情感计算方法对相应的属性或整体进行情感满意度计算。本论文利用的评论数据来源于酒店预订部分的评论,通过对评论数据的详细分析以及对其他评论数据挖掘的研究,本文提出的方法通过实验进行了验证,经实验结果表明,该方法不仅合理有效、具有良好的可行性,而且也有较好的应用前景。