论文部分内容阅读
摘 要:基于京东商城上6491对追加评论,运用情感分析对追加评论组按照情感效价、情感强度、时间距离进行分类,运用秩和检验等方法对不同类型追加评论的特征及其感知有用性进行了探究。研究发现:(1)相对于一次性评论,追加评论能够带给消费者更多的有用性感知。(2)相对于追评为正组,追评为负组给消费者的感知有用性更大。(3)对于前后效价一致和“初正追负”的两次评论,追评情感强度强于初评,但对于“初负追正”组,追评的情感强度小于初评。(4)搜索品的时间间隔显著大于体验品;对于搜索品来说,时间间隔较长的追加评论感知有用性强于时间间隔短的追加评论,而对于体验品来说,时间间隔较短的追加评论感知有用性强于时间间隔长的追加评论。
关键词:追加评论;感知有用性;情感效价;情感强度;时间距离
Abstract:Based on the 6491 pairs of additional reviews of JD.com, the sentiment analysis is used to classify additional review groups according to emotional valence, emotional intensity and time distance. The rank sum test is used to analyze the characteristics of different types of additional reviews and their perceived usefulness. The study found that:(1) Compared with one-time reviews, additional reviews can bring more usefulness perceptions to consumers; (2) Compared with the additional reviews whose second review is positive, those whose second review is negative give consumers more perceived usefulness. (3)For the additional reviews whose two reviews’ valence are same, the emotional intensity of the second review is stronger than the first review, so is the additional reviews whose first review is positive and second second review is negative. But for the additional reviews whose first review is negative and second review is positive, the emotional intensity of the first review is stronger than the second review (4) The time interval of the search product is significantly larger than the experience product. For the search product, the additional reviews with longer time interval is more useful than the additional reviews with short time interval. And for the experience product, additional reviews with shorter time are more useful than those with a long interval.
Key words:additional reviews; perceived usefulness; emotional valence; emotional intensity; time distance
電商给人们生活带来极大便利,但是其虚拟性一直是消费者对商品服务质量感知不足的重要因素,网络口碑应运而生并随着电商的发展不断发展和完善。CNNIC的调查显示,网络口碑是消费者网购决策时最关注的信息。尽管网络口碑在帮助消费者了解商品的过程中发挥了巨大作用,但是评论信息本身所具有的海量性、差异性、匿名性等特征也会让消费者无所适从,难以甄别信息的真伪。另一方面,商家惯于采取一些策略来操纵口碑的整体方向,如好评返现、刷好评、删差评等,这也再一次降低了消费者对在线评论的信任度。
电商平台也在不断完善在线评价系统以适应电商发展的需要,如区分评论类型、形成商品评论标签、评论的点赞和留言交流、晒商品照片视频等。追加评价是近些年电商评价体系的重要创新,买家在交易成功并给出首次评价之后,还有一次机会对后续使用过程中出现的情况进行补充评价。相比较于一般评论,包含追加评论的评论可以提供给浏览者更多信息,也因此吸引了学者们的关注。王长征、石文华、李琪等学者的研究均证明追加型评论相比较一次性评论有诸多特点,其对消费者的购买决策也会产生不同的影响。
本文借助爬虫技术获取真实网购评论数据,使用情感分析技术将评论数据按照情感效价、情感强度等维度进行分类。使用评论投票数指标代表评论的感知有用性,在此基础上对在线初次评论和在线追加评论的基本特征和感知有用性进行深度探索和比较分析。
1 相关文献述评研究假设
1.1 在线评论及其感知有用性 在线评论(online reviews)指的是消费者在电商网站购得商品后,对商品质量性能和使用体验的评价与反馈。相比较于企业的营销刺激(如广告、推销等),消费者更倾向于参考在线评论做出购买决策。但在线评论本身虚拟匿名、体量巨大、观点各异、真伪难辨的特点也加大了消费者对信息加工处理的难度。为了提高决策效率,消费者采纳评论之前倾向于对评论的有用性进行评估。学者们的研究集中在在线评论的特征和感知有用性的关系上,研究的角度包括评论情感效价、评论深度、评论极端性、情感强度等。 也有学者证明了评论来源(发表者专业性、是否匿名、地理位置、可靠性等)、评论接收者特征(如性别、接收者专业性、涉入度)会影响评论接收者对评论有用性的感知判断。此外,系统操控、商品类型、平台类型等也常被纳入影响因素。但上述对于在线评论的研究主要针对一般性评论,鲜有涉及追加评论。
1.2 追加评论的相关研究
为方便下文论述,将不包含追加评论的一般性评论称为一次性评论,将既包含初次评论(以下简称初评),又包含追加评论(以下简称追评)的评论称为两次评论。 相对于一次性评论,两次评论在数量上多了一次,但发表主体却都是同一个人。追评还包括產品其他维度的信息,例如随着使用时间的延长,消费者对产品态度的变化。 此外,在评论数量、评论长度和情感强度等方面,两种类型的评价也存在诸多差异。王长征基于归因理论证明了追加评论的感知有用性强于一次性评论,且矛盾型追加评论强于一致型追加评论。李琪等研究指出,矛盾型追加评论由于前后方向不一致,影响消费者的结果也不一样。总的来说,现有关于追加评价的研究比较匮乏,学者们对追加评论感知有用性的研究较多运用情景实验法。然而针对内容和观点丰富多样的追加评论,现有分类较为单一,研究维度划分也不够深入。本文通过爬虫技术获取大量真实评论作为研究材料,弥补了使用实验法构造评论语句的主观性,另外结合在线评论研究中常用到的维度,从情感效价、情感强度、时间间隔三个方面来刻画两次评论,并以此探究不同类型追加评论的感知有用性之间的差异。
1.3 假设演绎
1.3.1 一次性评论和两次评论
归因理论是人们如何推断和解释他人或自己的行为以及解释如何影响其自身态度和行为的社会心理学理论,常用于解释口碑或者其他营销活动的说服效果。消费者在阅读在线评论之后会对评论发布者的动机进行归因,常见的动机包括情感分享、经济回报、利他主义、产品卷入、支持/惩罚商家等。消费者对于归因为外部产品因素的在线评论感知有用性较高,而对于归因为主观因素的评论的感知有用性较低。对于两次评论来说:第一,追加评论意味着消费者需要额外付出一倍的时间和努力去完成追评,这种成本耗损会让阅读者认为评论者是基于真实体验(产品因素)发表的。第二,相比较于一次性评论大多是在收到货之后立即评价,追加评价的发表时间更加滞后,意味着追加评论的观点是由较长的使用时间支撑的,更具说服力。尤其对于一些耐用品来说,在收到货之后立即发表的一次性评价的参考意义不大。第三,追加评论的发表者只有在认为自己的初次评论没有达到信息说服效果的时候才会去补充说明,而追加评论补充说明的信息一般来讲更有价值。这会让阅读者认为发表者对产品的认识更全面,对自己的言论更负责任。第四,Mudambi研究发现评论深度对消费者的购买决策起到了正向作用。两次评论相对于一次性评论多了一条追加评论,所包含的信息更多,两条评论之间的态度和情感变化、时间间隔等细节也会给消费者提供大量的隐含信息。
综上,本文提出假设:
H1:消费者对于两次评论的感知有用性强于一次性评论。
1.3.2 不同效价的两次评论比较
评论效价指的是消费者在评论中表现出的对网购产品或服务整体的褒贬(正负)态度。Purnawirawan将评论的效价定义为评论的正负方向。Forman等研究发现阅读者对正向评论和负向评论的有用性感知均高于中性评论。Chevalier认为正向评论能够促进消费者的购买行为,而负向评论能够抑制消费者的购买行为。但更多学者偏向于认为在线评论中存在着较为显著的“负面偏差”现象,即消费者通常认为负面信息更具诊断价值,对其感知有用性更高,在做出购买决策时更依赖于负面信息。另外,商家对在线评论的影响和操纵也越来越常态化,刷好评、删差评等新闻报道屡见不鲜,进一步降低了消费者对好评的信任。
以往研究按照初评和追评情感倾向是否一致,分为一致型追评组和矛盾型追评组,且矛盾型追评的感知有用性强于一致型追评组。但是本文认为通过对“初负追正”型两次评论和“初负追负”型两次评论进行具体讨论可以推出,后者的感知有用性强于前者,而该假说有悖于矛盾型两次评论的感知有用性强于一致型两次评论的论断。分析如下:对于“初负追负”两次评论,虽然前后情感效价一致,不存在消费者态度的反转,但是消费者对商品的不满情绪在不断发酵上升。根据归因理论,评论阅读者会倾向于将评论者发表追评的动机归因于外在的产品因素,即商品出现一些新的不良的使用情况,进一步加大了评论者对商品的不满,最终导致评论者发表负面追加评论。而对于初负追正两次评论,本文认为考虑到评论者的“自我强化”动机(在他人面前表现良好),评论者在追评时承认自己初评 “错怪”商家,对其来说是困难的。而站在评论阅读者的视角,态度反转一方面反映了评论者发表观点不慎重,在没有对产品充分了解的情况下即对商品发表错误观点,这种前后矛盾显著降低了评论者的可信度。另一方面,在目前电商整体评论环境可信度不高的环境中,消费者很容易怀疑正向追评是评论者受到商家的诱导而发表的,这也进一步降低了“初负追正”两次评论的可信度。此外,“初正追正”两次评论是最常见的两次评论,其信息诊断性低且容易被怀疑受到商家操控,因此其感知有用性是四种类型中最低的。而对于“初正追负”两次评论,评论者使用负向追评修改正向初评的观点,说明后续使用商品的过程中出现了让评论者态度反转的因素,而该因素往往是产品因素。根据归因理论,消费者对归因为外部产品因素的评论信息的感知有用性更高。虽然“初正追负”的两次评论也存在前后效价不一致会有悖于评论者的自我强化动机,但是本文认为,消费者惩罚商家的动机要强于自我强化动机。综上,本文认为相对于追评,初评发表一般比较草率,而追评的效价在两次评论中的诊断性更高。因此,以追评的效价划分维度,负向追评的感知有用性要大于正向追评的感知有用性(即“初正追负”和“初负追负”的两次评论感知有用性大于“初正追正”和“初负追正”的感知有用性)。 综上,本文提出假设:
H2:追评为负的两次评论的感知有用性大于追评为正的两次评论。
1.3.3 两次评论的情感强度
评论的情感分析一般涉及情感倾向和情感强度两个方面。情感强度是指情感倾向的强弱程度,是人们对于某一事件所持观点的情感倾向值。消费者发表在线评论时,往往会表达出自己对产品的喜好或厌恶,以及对服务、售后等多方面的情感,而情感强度能反映评论的主观性信息。郑丽娟的研究证明了程度副词可以加强其修饰的情感词的情感强度,例如都是形容产品质量差的评论观点,“质量比较差”和“质量非常差”传达给阅读者的情感感受是不同的,后者显然比前者的情感更强烈。现有研究中较多关注于一次性评论的情感强度,而对两次评论之间情感强度的异同关注较少。
对于“初正追正”两次评论,消费者愿意花费时间和精力再次发表正向追评,说明消费者对商品服务极度满意,或者说随着时间的推移消费者对商品的满意度呈上升状态。由此可以得出,追评的情感强度显然要大于初评。而对于“初负追负”两次评论,随着对商品的使用,消费者对商品不满的情绪会继续累积。当达到一定限度值之后,消费者决定通过追加评论再次发泄自己的不满情绪,以此惩罚商家。因此,对于前后均为负向的两次评论,追评的情感强度大于初评。对于“初正追负”的两次评论,消费者的态度由好变差。电商平台评论规则规定消费者只能将差评更改为好评而不能将好评更改为差评,亦即消费者给出好评之后,即便反悔也不能将其删除或者改写。出于惩罚商家和信息回报动机,评论者发表负向追评对不慎重和不理性的初评观点进行修正。评论者最终想表达出来的观点是对产品的负向态度,由于初次评论已经给出了正向态度,因此评论者在追评中要表现出更强烈的负向态度才能至少中和掉之前发表的正向观点。对于“初负追正”的两次评论, 评论者发表初次负评时认为产品体验糟糕,在使用一段时间之后评论者对产品的使用体验上升。消费者初次评论“错怪”产品和商家,之后消费者打算“认错”。本文认为基于自我强化动机,消费者会倾向于轻微认错,即评论者虽然在追评中会给出正面修正反馈,但是情感强度会降低。
综上,本文提出如下假设:
H3a:对于“初正追正”两次评论,追评的情感强度大于追评。
H3b:对于“初负追负”两次评论,追评的情感强度大于追评。
H3c:对于“初正追负”两次评论,追评的情感强度大于初评。
H3d:对于“初负追正”两次评论,追评的情感强度小于初评。
1.3.4 两次评论的时间间隔
在线评论具有时间效应,新发表的评论反映了商品的最新情况,因此消费者更倾向于浏览发表时间较近的评论。一次性评论一般是消费者在交易完成(收到货物)之后较短时间内给出的评价,观点缺少使用时间的支撑。而两次评论是同一买家在购买后不同时间发表的,追加评价前会显示评论者是在“购买N天后追评”。时间间隔反映了追加评论是评论者使用了一段时间之后发表的,比初始评价更具说服力,这也是阅读者将两次评论信息归因为产品客观因素的重要原因。王长征等发现相比于较短的时间间隔,较长的时间间隔会加强矛盾性追加评论的感知有用性。石文华的研究证明了产品价格正向影响追加评论的时间间隔。本文按照Nelson的分类方法引入商品类型变量:搜索型商品指的是消费者在购买之前通过商品的客观属性即可以对商品有较好的质量感知(如3C数码产品),而体验型商品的质量涉及个人偏好及主观性的判断,必须在消费者使用之后才能对其进行质量感知(如音乐)。搜索型产品往往需要一段时间的使用才能更加深入地了解产品的特性,因此追评时间距离如果太近,让评论阅读者感知到的耐用性信息不多。而体验型产品可以在较短时间内熟悉产品,消费者在使用若干次以后即可以对其形成较全面的质量感知。如果追加评论相隔的时间过长,会让阅读者认为体验品的即时体验感觉已经过期,从而对追加评论的有用性感知降低。因此,基于以上分析和推理,假设如下:
H4:搜索品追加评论的时间间隔要显著长于体验品。
H4a:对于体验品来说,时间间隔较短的追加评论的感知有用性强于时间间隔较长的追加评论。
H4b:对于搜索品来说,时间间隔较长的追加评论的感知有用性强于时间间隔较短的追加评论。
研究模型见图1。
2 实证研究
2.1 研究对象和数据获取
以往研究中常用到的体验型产品包括电影、音乐 CD、巧克力等,而常用到的搜索型产品主要是一些数码 3C 产品,包括U盘、数码相机、笔记本电脑等。通过小规模问卷调查的方法最终选取价格区间大致重合且消费者都比较熟悉的U盘和洗面奶作为研究对象。人们在购买前通过U盘的尺寸、材质、容量、读写速度等基本参数即可以对U盘的性能有比较清楚的了解,买到手的U盘一般性能和参数相差不大。而洗面奶中包含了各种消费者不了解的化学成分,即便商家对洗面奶的主要化学成分和功效进行了解释,消费者也必须在亲自使用之后才能感受到洗面奶的质量。从电商网站上搜索洗面奶和U盘会发现,两种商品的价格大致分布为30~120元,控制了价格对本文的影响。
选取京东网站作为采集数据的来源,2019年4月1日,在京东的商品搜索框中输入“U盘”和“洗面奶”分别進行搜索,选取默认综合排序前十位的商品作为研究的数据采集对象。爬取的数据字段包括商品名称、评论者ID、初评文本、追评文本、追评间隔时间、投票数、评论数、店铺回复内容等。评论日期跨度从2018年3月31日到2019年4月1日。经过数据清洗,删除掉重复评论、错值评论、初评或者追评缺失的默认评论、无关信息评论以及投票数为0的评论,最终得到洗面奶的一次性评论9660条,两次评论3263对,得到U盘的一次性评论9681条,两次评论3228对,样本数量满足研究需要。 2.2 变量的操作化定义
本文使用Python调用百度AI开放平台的自然语言处理API(以下简称百度NLP)对评论进行初步的情感分析。百度NLP能够准确地对中文文本的情感极性进行分析并给出相应置信度(用E表示),其词库量级和分析算法决定其分析精度高于一般学术研究中的自建词库,且已有学者在研究中运用。本文借鉴石文华的研究使用极性类别的置信度来表示情感强度,由此可以得到在线追加评论的情感倾向和情感强度值。
关于感知有用性的测量,以往文献有使用“有用”投票占总投票数目的比值代表的,也有用“有用投票數”减去无用投票数代表的,还有直接用“有用投票数”代表的。本文使用投票数测量感知有用性。考虑到电商网站一般优先显示最新的评论,本文假设发表于不同时间的评论被浏览者阅读到的概率是一样的,即忽略评论的时效性。而追加评论的时间间隔直接使用采集到的数据表示,并参考张艳丰的研究将时间间隔分为短期(0~19天)和长期(20~180天)两个阶段。变量的操作化定义见表1,部分处理后的数据截图见图2。
对主要变量评论投票数、情感强度值、时间间隔等变量进行正态性和方差齐次性检验,发现均不满足,故本文采用Mann-Whitney U 检验等秩和检验方法代替T检验分析。
2.3 数据的描述性统计
对四种评价的数量占比统计,由图3可知,洗面奶和U盘的数量占比分布非常接近:“初正追正”的两次评论占比最大,大约为60%;“初正追负”和“初负追负”的比例相当,大约16%;“初负追正”所占比例最小,仅有7%。按照评论时间间隔的长短分布统计,发现U盘的追加评论更倾向于较晚发表,而洗面奶的追加评论更倾向于较早发表,这与H4a和H4b是符合的,统计学意义有待进一步验证。
按照商品类型、情感效价两个维度对评论文本的平均长度进行统计描述,可以得到如图5统计。U盘和洗面奶的整体分布情况类似。在四种不同类型的评论中,“初正追正”“初负追正”“初负追负”三种评论的追评字数均少于初评字数,而只有“初正追负”型的追评字数多于初评字数。初正追负型两次评论一般比较契合人们对追加评论的第一印象,即消费者态度由好变坏的“反悔现象”,这也反映了消费者的正向初评被“辜负”后,倾向于对商品开启“疯狂吐槽”。另外,可以观察到矛盾型两次评论(即“初正追负”和“初负追正”),无论负向评论出现的位置在初评还是在追评处,负向评论平均文本长度要长于正向评论,反映出负向评论所反映的信息比正向评论更丰富。而一致型两次评论(即“初正追正”和“初负追负”),初评的信息量总是比起补充作用的追评多。
2.4 感知有用性差异检验
2.4.1 一次评论和两次评论比较
首先对一次性评论和两次评论的感知有用性差异进行检验。采用Mann-Whitney U 检验,结果见表2:两次评论的秩均值高于一次性评论,M一次评论=12663.703 2.4.2 追加评价的效价比较
对追评效价不同的两次评论感知有用性进行比较,发现M追评为正=3139.392 2.4.3 追加评论情感强度比较
将每组评论的初评和追评作为一个配对,使用Wilcoxon 带符号秩检验。由表4可知,当初次评论和追加评论均为正向时:正秩=2273>负秩=1575,p=0.000,在0.001的显著性水平下显著。对于“初正追正”的两次评论,追评的情感强度强于初评的情感强度,H3a得证。当初次评论和追加评论均为负向时:正秩=591>负秩=342,p=0.000,在0.001的显著性水平下显著。这表明对于“初负追负”的两次评论,追评的情感强度强于初评的情感强度,H3b得证。综上,可以得到对于一致型两次评论来说,消费者在追加评论时一般表现出更强的情感强度。
由表5可知,当初次评论为正向、追加评论为负向时,负秩=499>正秩=398,p=0.000,在0.001的显著性水平下显著。H3c得证,表明对于“初正追负”的两次评论来说,追评的情感强度大于初评。当初次评论为负向、追加评论为正向时,正秩=273>负秩=210,p=0.005,在0.05的显著性水平下显著。H3d得证,表明对于“初负追正”的两次评论来说,追评的情感强度小于初评。
2.4.4 追加评论时间间隔比较
对于搜索品和体验品的追加评论时间间隔特征进行检验,结果见表6:时间间隔的秩均值MU盘=3315.80>M洗面奶=3176.95,且p=0.003,在0.05的显著性水平下显著。H4得证,表明搜索品追加评论的时间间隔要显著长于体验品。
3 结论
3.1 研究结论
本文通过采集京东商城的真实评论,使用自然语言处理技术对在线评论进行效价分类和情感强度测量。研究发现:相比较于一次性评论,消费者对于两次评论的感知有用性更强。此外,以两次评论为研究重点,探究了初评和追评在效价、情感强度、时间间隔维度上的不同组合对评论感知有用性的影响。
关于情感效价的研究,将追加评论按照追评的方向分为“追评为正”和“追评为负”,结果显示消费者对于负向追评类的感知有用性大于正向追评类的感知有用性,该分类方法虽与王长征等学者不同,但是验证了王翠翠眼动实验的结果。通过不同效价组合的初评和追评情感强度比较发现:一致型追加评论“初正追正”和“初负追负”组中,追评的情感强度大于初评;而对于矛盾型追加评论,“初正追负”组追评的情感强度大于初评;“初负追正”组的追评的情感强度小于初评。对不同类型商品的追评时间间隔研究发现:搜索品两次评论的时间间隔要显著长于体验品;且对于体验品来说,时间间隔较短的两次评论的感知有用性强于时间间隔较长的两次评论;而对于搜索品来说,时间间隔较长的两次评论的感知有用性强于时间间隔较短的两次评论。 3.2 理论意义和实践意义
以往研究大多聚焦于一次性评论,本文对追加评论提出的新观点是对现有研究的有益补充。在研究方法方面,以往对在线评论感知有用性的研究大致采用两种方法,一种是通过量表来测量被试在不同评论环境中的感知有用性;另一种是使用爬虫技术爬取真实评论,将感知有用性作为因变量构建回归模型,探究相关因素的影响是否显著。本文结合了两种方法,数据来源于爬虫技术爬取的真实评论,感知有用性的研究使用非参数检验的秩均值比较,这是对感知有用性探究方法的补充。另外,本文并没有自建词库赋值进行情感分析,而是调用百度AI开放平台的自然语言处理,一方面简化了研究步骤并降低了研究难度,另一方面使用国内最先进的商用语言处理平台,更加适用于本文对象,大大提高了情感分析的准确性。
研究结果显示追加评论比一次性评论的感知有用性更高,因此商家不仅仅要鼓励消费者发表评论,更要在消费者购买一定日期之后通过优惠券激励等方式鼓励消费者发表追加评论。一般来说,商家在鼓励追加评论时并没有要求追评的时间,所以只是为了得到奖励的消费者在初次评论之后就立即追加评论,而这种评论感知有用性是不高的。通过本文可以发现对于搜索品,消费者对于时间间隔较大的追评感知有用性更高,而对于体验品正好相反。商家应该根据商品生命周期等因素,在消费者初评之后的特定时间段通过短信等方式引导消费者给出积极追加评价,例如引导洗面奶的追评可以在初次评论的20天以内,而U盘追评在初评的30天以后。商家应该在消费者可能发表评论的期间与消费者保持密切沟通,避免消费者给出负面评价。无论是初评还是追评出现负面信息,都会很快抓住消费者的眼球,降低消费者的购买意愿。因此,商家应该坚决避免出现初次评价和追加评价均为负向的评价。在初次评论为负向之后,商家应该通过补偿等方式安抚消费者,避免消费者情绪恶化,给出情感强度更激烈的负向追评。如果提升了消费者售后满意度,并鼓励消费者将售后处理的满意度详细体现在追加评论中,无疑是一个加分项,会对商品口碑起到积极作用。同时,商家也应该利用大数据分析方法实时监测消费者口碑动态,做到及时发现问题并处理。
对于消费者来说,在浏览在线评论的时候应该要着重关注诊断性信息较多的追加评论,对于前后情感倾向矛盾的追加评论更要重点浏览。目前主流电商平台都有对评论点赞询问的功能,评价发布者可以看到并回复。如果消费者想了解更多追加评论中出现的细节,可以浏览评论区回复,或者直接评论请求楼主回答。
3.3 研究局限和未来展望
本文仍存在一定局限性:在样本数量上,由于目前主流电商网站均设有反爬虫机制,导致收集到的评论信息数量不够大。为此,本文共选取10种U盘和10种洗面奶来提高数据规模,在提高数据量的同时也忽略了不同类型产品评论之间可能存在的整体差异,后续研究可以继續扩大研究的商品种类和数据体量。此外,本文对情感强度的研究不够具体,后续可以将效价和情感强度组合进行细化研究。
本文对商品类型的分类采取搜索品和体验品,在消费者研究领域还有享乐品&实用品、高卷入度&低卷入度、社会距离远&近等维度,在后续研究中可以对商品类型进一步细化。此外,本文在数据收集阶段发现,初评默认好评的追加评价也占比较大,这种评论的感知有用性甚至大于“初正追正”的两次评论,也值得学者关注。
参考文献:
[1] 中国互联网络信息中心(CNNIC). 2015 年中国网络购物市场研究报告[R]. 2016.
[2] 淘宝.淘宝网评价规范[R]. 2015.
[3] 王长征, 何钐, 王魁. 网络口碑中追加评论的有用性感知研究[J]. 管理科学, 2015, 28(3):102-14.
[4] 石文华, 龚雪, 张绮, 等. 在线初次评论与在线追加评论的比较研究[J]. 管理科学, 2016, 29(4):45-58.
[5] 石文华, 王璐, 绳娜, 等. 在线初次评论与在线追加评论对商品销量影响的比较研究[J]. 管理评论, 2018, 30(1):144-53.
[6] 李琪, 任小静. 矛盾性追加评论对感知有用性的影响效应研究[J]. 管理科学, 2017, 30(4):139-50.
[7] HERR P M, KARDES F R, KIM J. Effects of word-of-mouth and product-attribute information on persuasion:an accessibility-diagnosticity perspective[J]. Journal of Consumer Research, 1991, 17(4):454-62.
[8] LACZNIAK R N, DECARLO T E, RAMASWAMI S N. Consumers’ responses to negative word-of-mouth communication:an attribution theory perspective[J]. Journal of Consumer Psychology, 2001, 11(1):57-73.
[9] JIN L, HU B, HE Y. The recent versus the out-dated:an experimental examination of the time-variant effects of online consumer eeviews[J]. Journal of Retailing, 2014, 90(4):552-66.
[10] CHEN Z, LURIE N H. Temporal contiguity and negativity bias in the impact of online word of mouth[J]. Journal of Marketing Research (JMR), 2013, 50(4):463-76. [11] 卢向华, 冯越. 网络口碑的价值——基于在线餐馆点评的实证研究 [J]. 管理世界, 2009(7):126-32.
[12] 龚诗阳, 刘霞, 赵平. 线上消费者评论如何影响产品销量?——基于在线图书评论的实证研究 [J]. 中国软科学, 2013(6):171-83.
[13] GHOSE A, IPEIROTIS P G. Designing novel review ranking systems:predicting usefulness and impact of reviews; proceedings of the International Conference on Electronic Commerce, F, 2007 [C].
[14] RACHERLA P, FRISKE W. Perceived ‘usefulness’ of online consumer reviews:an exploratory investigation across three services categories[J]. Electronic Commerce Research & Applications, 2012, 11(6):548-59.
[15] SCHUFF D. What makes a helpful online review? a study of customer reviews on amazon.com[J]. Social Science Electronic Publishing, 2012, 34(1):185-200.
[16] FORMAN C, GHOSE A, WIESENFELD B. Examining the relationship between reviews and sales:the role of reviewer identity disclosure in electronic markets[J]. Information Systems Research, 2008, 19(3):291-313.
[17] PAVLOU P A, FYGENSON M. Understanding and prediction electronic commerce adoption:an extension of the theory of planned behavior[J]. MIS Quarterly, 2006, 30(1):115-43.
[18] SCHLOSSER A E. Source Perceptions and the persuasiveness of internet word-of-mouth communication[J]. Advances in Consumer Research, 2005, 32(1):202-203.
[19] 楊亮,林原,林鸿飞. 基于情感分布的微博热点事件发现 [J]. 中文信息学报, 2012, 26(1):84-91.
[20] 蔡淑琴, 秦志勇, 李翠萍, 等. 面向负面在线评论的情感强度对有用性的影响研究 [J]. 管理评论, 2017, 29(2):79-86.
[21] 徐琳宏, 林鸿飞, 潘宇, 等. 情感词汇本体的构造 [J]. 情报学报, 2008, 27(2):180-5.
[22] NAN H, LING L, JIE J Z. Do online reviews affect product sales? The role of reviewer characteristics and temporal effects [J]. Information Technology & Management, 2008, 9(3):201-14.
[23] GODES D, MAYZLIN D. Firm-created word-of-mouth communication:evidence from a field test [J]. Marketing Science, 2009, 28(4):721-39.
[24] GARBARINO E, STRAHILEVITZ M. Gender differences in the perceived risk of buying online and the effects of receiving a site recommendation[J]. Journal of Business Research, 2004, 57(7):768-75.
[25] 杜学美, 丁璟妤, 谢志鸿, 等. 在线评论对消费者购买意愿的影响研究 [J]. 管理评论, 2016, 28(3):173-83.
[26] MAN Y C, LUO C, SIA C L, et al. Credibility of electronic word-of-mouth:informational and normative determinants of on-line consumer recommendations[J]. International Journal of Electronic Commerce, 2009, 13(4):9-38.
[27] 闵庆飞, 覃亮, 张克亮. 影响在线评论有用性的因素研究[J]. 管理评论, 2017, 29(10):95-107.
[28] MUDAMBI S M, SCHUFF D. What makes a helpful online review? a study of customer reviews on amazon.com[M]. 2010.
[29] 张艳辉, 李宗伟. 在线评论有用性的影响因素研究:基于产品类型的调节效应[J]. 管理评论, 2016, 28(10):123-32.
[30] 李琪, 任小静. 消费者对不同平台类型正面在线评论感知有用性的差异研究[J]. 经济问题探索, 2015(10):41-7.
[31] GOLDSMITH R E, HOROWITZ D. Measuring motivations for online opinion seeking[J]. Journal of Interactive Advertising, 2006, 6(2):1-14.
[32] DELLAROCAS C, ZHANG X, AWAD N F. Exploring the value of online product reviews in forecasting sales:The case of motion pictures[J]. Journal of Interactive Marketing, 2007, 21(4):23-45.
[33] SUNDARAM D S, MITRA K, WEBSTER C. Word-of-mouth communications:a motivational analysis[J]. Advances in Consumer Research, 1998, 25(1):527-531.
关键词:追加评论;感知有用性;情感效价;情感强度;时间距离
Abstract:Based on the 6491 pairs of additional reviews of JD.com, the sentiment analysis is used to classify additional review groups according to emotional valence, emotional intensity and time distance. The rank sum test is used to analyze the characteristics of different types of additional reviews and their perceived usefulness. The study found that:(1) Compared with one-time reviews, additional reviews can bring more usefulness perceptions to consumers; (2) Compared with the additional reviews whose second review is positive, those whose second review is negative give consumers more perceived usefulness. (3)For the additional reviews whose two reviews’ valence are same, the emotional intensity of the second review is stronger than the first review, so is the additional reviews whose first review is positive and second second review is negative. But for the additional reviews whose first review is negative and second review is positive, the emotional intensity of the first review is stronger than the second review (4) The time interval of the search product is significantly larger than the experience product. For the search product, the additional reviews with longer time interval is more useful than the additional reviews with short time interval. And for the experience product, additional reviews with shorter time are more useful than those with a long interval.
Key words:additional reviews; perceived usefulness; emotional valence; emotional intensity; time distance
電商给人们生活带来极大便利,但是其虚拟性一直是消费者对商品服务质量感知不足的重要因素,网络口碑应运而生并随着电商的发展不断发展和完善。CNNIC的调查显示,网络口碑是消费者网购决策时最关注的信息。尽管网络口碑在帮助消费者了解商品的过程中发挥了巨大作用,但是评论信息本身所具有的海量性、差异性、匿名性等特征也会让消费者无所适从,难以甄别信息的真伪。另一方面,商家惯于采取一些策略来操纵口碑的整体方向,如好评返现、刷好评、删差评等,这也再一次降低了消费者对在线评论的信任度。
电商平台也在不断完善在线评价系统以适应电商发展的需要,如区分评论类型、形成商品评论标签、评论的点赞和留言交流、晒商品照片视频等。追加评价是近些年电商评价体系的重要创新,买家在交易成功并给出首次评价之后,还有一次机会对后续使用过程中出现的情况进行补充评价。相比较于一般评论,包含追加评论的评论可以提供给浏览者更多信息,也因此吸引了学者们的关注。王长征、石文华、李琪等学者的研究均证明追加型评论相比较一次性评论有诸多特点,其对消费者的购买决策也会产生不同的影响。
本文借助爬虫技术获取真实网购评论数据,使用情感分析技术将评论数据按照情感效价、情感强度等维度进行分类。使用评论投票数指标代表评论的感知有用性,在此基础上对在线初次评论和在线追加评论的基本特征和感知有用性进行深度探索和比较分析。
1 相关文献述评研究假设
1.1 在线评论及其感知有用性 在线评论(online reviews)指的是消费者在电商网站购得商品后,对商品质量性能和使用体验的评价与反馈。相比较于企业的营销刺激(如广告、推销等),消费者更倾向于参考在线评论做出购买决策。但在线评论本身虚拟匿名、体量巨大、观点各异、真伪难辨的特点也加大了消费者对信息加工处理的难度。为了提高决策效率,消费者采纳评论之前倾向于对评论的有用性进行评估。学者们的研究集中在在线评论的特征和感知有用性的关系上,研究的角度包括评论情感效价、评论深度、评论极端性、情感强度等。 也有学者证明了评论来源(发表者专业性、是否匿名、地理位置、可靠性等)、评论接收者特征(如性别、接收者专业性、涉入度)会影响评论接收者对评论有用性的感知判断。此外,系统操控、商品类型、平台类型等也常被纳入影响因素。但上述对于在线评论的研究主要针对一般性评论,鲜有涉及追加评论。
1.2 追加评论的相关研究
为方便下文论述,将不包含追加评论的一般性评论称为一次性评论,将既包含初次评论(以下简称初评),又包含追加评论(以下简称追评)的评论称为两次评论。 相对于一次性评论,两次评论在数量上多了一次,但发表主体却都是同一个人。追评还包括產品其他维度的信息,例如随着使用时间的延长,消费者对产品态度的变化。 此外,在评论数量、评论长度和情感强度等方面,两种类型的评价也存在诸多差异。王长征基于归因理论证明了追加评论的感知有用性强于一次性评论,且矛盾型追加评论强于一致型追加评论。李琪等研究指出,矛盾型追加评论由于前后方向不一致,影响消费者的结果也不一样。总的来说,现有关于追加评价的研究比较匮乏,学者们对追加评论感知有用性的研究较多运用情景实验法。然而针对内容和观点丰富多样的追加评论,现有分类较为单一,研究维度划分也不够深入。本文通过爬虫技术获取大量真实评论作为研究材料,弥补了使用实验法构造评论语句的主观性,另外结合在线评论研究中常用到的维度,从情感效价、情感强度、时间间隔三个方面来刻画两次评论,并以此探究不同类型追加评论的感知有用性之间的差异。
1.3 假设演绎
1.3.1 一次性评论和两次评论
归因理论是人们如何推断和解释他人或自己的行为以及解释如何影响其自身态度和行为的社会心理学理论,常用于解释口碑或者其他营销活动的说服效果。消费者在阅读在线评论之后会对评论发布者的动机进行归因,常见的动机包括情感分享、经济回报、利他主义、产品卷入、支持/惩罚商家等。消费者对于归因为外部产品因素的在线评论感知有用性较高,而对于归因为主观因素的评论的感知有用性较低。对于两次评论来说:第一,追加评论意味着消费者需要额外付出一倍的时间和努力去完成追评,这种成本耗损会让阅读者认为评论者是基于真实体验(产品因素)发表的。第二,相比较于一次性评论大多是在收到货之后立即评价,追加评价的发表时间更加滞后,意味着追加评论的观点是由较长的使用时间支撑的,更具说服力。尤其对于一些耐用品来说,在收到货之后立即发表的一次性评价的参考意义不大。第三,追加评论的发表者只有在认为自己的初次评论没有达到信息说服效果的时候才会去补充说明,而追加评论补充说明的信息一般来讲更有价值。这会让阅读者认为发表者对产品的认识更全面,对自己的言论更负责任。第四,Mudambi研究发现评论深度对消费者的购买决策起到了正向作用。两次评论相对于一次性评论多了一条追加评论,所包含的信息更多,两条评论之间的态度和情感变化、时间间隔等细节也会给消费者提供大量的隐含信息。
综上,本文提出假设:
H1:消费者对于两次评论的感知有用性强于一次性评论。
1.3.2 不同效价的两次评论比较
评论效价指的是消费者在评论中表现出的对网购产品或服务整体的褒贬(正负)态度。Purnawirawan将评论的效价定义为评论的正负方向。Forman等研究发现阅读者对正向评论和负向评论的有用性感知均高于中性评论。Chevalier认为正向评论能够促进消费者的购买行为,而负向评论能够抑制消费者的购买行为。但更多学者偏向于认为在线评论中存在着较为显著的“负面偏差”现象,即消费者通常认为负面信息更具诊断价值,对其感知有用性更高,在做出购买决策时更依赖于负面信息。另外,商家对在线评论的影响和操纵也越来越常态化,刷好评、删差评等新闻报道屡见不鲜,进一步降低了消费者对好评的信任。
以往研究按照初评和追评情感倾向是否一致,分为一致型追评组和矛盾型追评组,且矛盾型追评的感知有用性强于一致型追评组。但是本文认为通过对“初负追正”型两次评论和“初负追负”型两次评论进行具体讨论可以推出,后者的感知有用性强于前者,而该假说有悖于矛盾型两次评论的感知有用性强于一致型两次评论的论断。分析如下:对于“初负追负”两次评论,虽然前后情感效价一致,不存在消费者态度的反转,但是消费者对商品的不满情绪在不断发酵上升。根据归因理论,评论阅读者会倾向于将评论者发表追评的动机归因于外在的产品因素,即商品出现一些新的不良的使用情况,进一步加大了评论者对商品的不满,最终导致评论者发表负面追加评论。而对于初负追正两次评论,本文认为考虑到评论者的“自我强化”动机(在他人面前表现良好),评论者在追评时承认自己初评 “错怪”商家,对其来说是困难的。而站在评论阅读者的视角,态度反转一方面反映了评论者发表观点不慎重,在没有对产品充分了解的情况下即对商品发表错误观点,这种前后矛盾显著降低了评论者的可信度。另一方面,在目前电商整体评论环境可信度不高的环境中,消费者很容易怀疑正向追评是评论者受到商家的诱导而发表的,这也进一步降低了“初负追正”两次评论的可信度。此外,“初正追正”两次评论是最常见的两次评论,其信息诊断性低且容易被怀疑受到商家操控,因此其感知有用性是四种类型中最低的。而对于“初正追负”两次评论,评论者使用负向追评修改正向初评的观点,说明后续使用商品的过程中出现了让评论者态度反转的因素,而该因素往往是产品因素。根据归因理论,消费者对归因为外部产品因素的评论信息的感知有用性更高。虽然“初正追负”的两次评论也存在前后效价不一致会有悖于评论者的自我强化动机,但是本文认为,消费者惩罚商家的动机要强于自我强化动机。综上,本文认为相对于追评,初评发表一般比较草率,而追评的效价在两次评论中的诊断性更高。因此,以追评的效价划分维度,负向追评的感知有用性要大于正向追评的感知有用性(即“初正追负”和“初负追负”的两次评论感知有用性大于“初正追正”和“初负追正”的感知有用性)。 综上,本文提出假设:
H2:追评为负的两次评论的感知有用性大于追评为正的两次评论。
1.3.3 两次评论的情感强度
评论的情感分析一般涉及情感倾向和情感强度两个方面。情感强度是指情感倾向的强弱程度,是人们对于某一事件所持观点的情感倾向值。消费者发表在线评论时,往往会表达出自己对产品的喜好或厌恶,以及对服务、售后等多方面的情感,而情感强度能反映评论的主观性信息。郑丽娟的研究证明了程度副词可以加强其修饰的情感词的情感强度,例如都是形容产品质量差的评论观点,“质量比较差”和“质量非常差”传达给阅读者的情感感受是不同的,后者显然比前者的情感更强烈。现有研究中较多关注于一次性评论的情感强度,而对两次评论之间情感强度的异同关注较少。
对于“初正追正”两次评论,消费者愿意花费时间和精力再次发表正向追评,说明消费者对商品服务极度满意,或者说随着时间的推移消费者对商品的满意度呈上升状态。由此可以得出,追评的情感强度显然要大于初评。而对于“初负追负”两次评论,随着对商品的使用,消费者对商品不满的情绪会继续累积。当达到一定限度值之后,消费者决定通过追加评论再次发泄自己的不满情绪,以此惩罚商家。因此,对于前后均为负向的两次评论,追评的情感强度大于初评。对于“初正追负”的两次评论,消费者的态度由好变差。电商平台评论规则规定消费者只能将差评更改为好评而不能将好评更改为差评,亦即消费者给出好评之后,即便反悔也不能将其删除或者改写。出于惩罚商家和信息回报动机,评论者发表负向追评对不慎重和不理性的初评观点进行修正。评论者最终想表达出来的观点是对产品的负向态度,由于初次评论已经给出了正向态度,因此评论者在追评中要表现出更强烈的负向态度才能至少中和掉之前发表的正向观点。对于“初负追正”的两次评论, 评论者发表初次负评时认为产品体验糟糕,在使用一段时间之后评论者对产品的使用体验上升。消费者初次评论“错怪”产品和商家,之后消费者打算“认错”。本文认为基于自我强化动机,消费者会倾向于轻微认错,即评论者虽然在追评中会给出正面修正反馈,但是情感强度会降低。
综上,本文提出如下假设:
H3a:对于“初正追正”两次评论,追评的情感强度大于追评。
H3b:对于“初负追负”两次评论,追评的情感强度大于追评。
H3c:对于“初正追负”两次评论,追评的情感强度大于初评。
H3d:对于“初负追正”两次评论,追评的情感强度小于初评。
1.3.4 两次评论的时间间隔
在线评论具有时间效应,新发表的评论反映了商品的最新情况,因此消费者更倾向于浏览发表时间较近的评论。一次性评论一般是消费者在交易完成(收到货物)之后较短时间内给出的评价,观点缺少使用时间的支撑。而两次评论是同一买家在购买后不同时间发表的,追加评价前会显示评论者是在“购买N天后追评”。时间间隔反映了追加评论是评论者使用了一段时间之后发表的,比初始评价更具说服力,这也是阅读者将两次评论信息归因为产品客观因素的重要原因。王长征等发现相比于较短的时间间隔,较长的时间间隔会加强矛盾性追加评论的感知有用性。石文华的研究证明了产品价格正向影响追加评论的时间间隔。本文按照Nelson的分类方法引入商品类型变量:搜索型商品指的是消费者在购买之前通过商品的客观属性即可以对商品有较好的质量感知(如3C数码产品),而体验型商品的质量涉及个人偏好及主观性的判断,必须在消费者使用之后才能对其进行质量感知(如音乐)。搜索型产品往往需要一段时间的使用才能更加深入地了解产品的特性,因此追评时间距离如果太近,让评论阅读者感知到的耐用性信息不多。而体验型产品可以在较短时间内熟悉产品,消费者在使用若干次以后即可以对其形成较全面的质量感知。如果追加评论相隔的时间过长,会让阅读者认为体验品的即时体验感觉已经过期,从而对追加评论的有用性感知降低。因此,基于以上分析和推理,假设如下:
H4:搜索品追加评论的时间间隔要显著长于体验品。
H4a:对于体验品来说,时间间隔较短的追加评论的感知有用性强于时间间隔较长的追加评论。
H4b:对于搜索品来说,时间间隔较长的追加评论的感知有用性强于时间间隔较短的追加评论。
研究模型见图1。
2 实证研究
2.1 研究对象和数据获取
以往研究中常用到的体验型产品包括电影、音乐 CD、巧克力等,而常用到的搜索型产品主要是一些数码 3C 产品,包括U盘、数码相机、笔记本电脑等。通过小规模问卷调查的方法最终选取价格区间大致重合且消费者都比较熟悉的U盘和洗面奶作为研究对象。人们在购买前通过U盘的尺寸、材质、容量、读写速度等基本参数即可以对U盘的性能有比较清楚的了解,买到手的U盘一般性能和参数相差不大。而洗面奶中包含了各种消费者不了解的化学成分,即便商家对洗面奶的主要化学成分和功效进行了解释,消费者也必须在亲自使用之后才能感受到洗面奶的质量。从电商网站上搜索洗面奶和U盘会发现,两种商品的价格大致分布为30~120元,控制了价格对本文的影响。
选取京东网站作为采集数据的来源,2019年4月1日,在京东的商品搜索框中输入“U盘”和“洗面奶”分别進行搜索,选取默认综合排序前十位的商品作为研究的数据采集对象。爬取的数据字段包括商品名称、评论者ID、初评文本、追评文本、追评间隔时间、投票数、评论数、店铺回复内容等。评论日期跨度从2018年3月31日到2019年4月1日。经过数据清洗,删除掉重复评论、错值评论、初评或者追评缺失的默认评论、无关信息评论以及投票数为0的评论,最终得到洗面奶的一次性评论9660条,两次评论3263对,得到U盘的一次性评论9681条,两次评论3228对,样本数量满足研究需要。 2.2 变量的操作化定义
本文使用Python调用百度AI开放平台的自然语言处理API(以下简称百度NLP)对评论进行初步的情感分析。百度NLP能够准确地对中文文本的情感极性进行分析并给出相应置信度(用E表示),其词库量级和分析算法决定其分析精度高于一般学术研究中的自建词库,且已有学者在研究中运用。本文借鉴石文华的研究使用极性类别的置信度来表示情感强度,由此可以得到在线追加评论的情感倾向和情感强度值。
关于感知有用性的测量,以往文献有使用“有用”投票占总投票数目的比值代表的,也有用“有用投票數”减去无用投票数代表的,还有直接用“有用投票数”代表的。本文使用投票数测量感知有用性。考虑到电商网站一般优先显示最新的评论,本文假设发表于不同时间的评论被浏览者阅读到的概率是一样的,即忽略评论的时效性。而追加评论的时间间隔直接使用采集到的数据表示,并参考张艳丰的研究将时间间隔分为短期(0~19天)和长期(20~180天)两个阶段。变量的操作化定义见表1,部分处理后的数据截图见图2。
对主要变量评论投票数、情感强度值、时间间隔等变量进行正态性和方差齐次性检验,发现均不满足,故本文采用Mann-Whitney U 检验等秩和检验方法代替T检验分析。
2.3 数据的描述性统计
对四种评价的数量占比统计,由图3可知,洗面奶和U盘的数量占比分布非常接近:“初正追正”的两次评论占比最大,大约为60%;“初正追负”和“初负追负”的比例相当,大约16%;“初负追正”所占比例最小,仅有7%。按照评论时间间隔的长短分布统计,发现U盘的追加评论更倾向于较晚发表,而洗面奶的追加评论更倾向于较早发表,这与H4a和H4b是符合的,统计学意义有待进一步验证。
按照商品类型、情感效价两个维度对评论文本的平均长度进行统计描述,可以得到如图5统计。U盘和洗面奶的整体分布情况类似。在四种不同类型的评论中,“初正追正”“初负追正”“初负追负”三种评论的追评字数均少于初评字数,而只有“初正追负”型的追评字数多于初评字数。初正追负型两次评论一般比较契合人们对追加评论的第一印象,即消费者态度由好变坏的“反悔现象”,这也反映了消费者的正向初评被“辜负”后,倾向于对商品开启“疯狂吐槽”。另外,可以观察到矛盾型两次评论(即“初正追负”和“初负追正”),无论负向评论出现的位置在初评还是在追评处,负向评论平均文本长度要长于正向评论,反映出负向评论所反映的信息比正向评论更丰富。而一致型两次评论(即“初正追正”和“初负追负”),初评的信息量总是比起补充作用的追评多。
2.4 感知有用性差异检验
2.4.1 一次评论和两次评论比较
首先对一次性评论和两次评论的感知有用性差异进行检验。采用Mann-Whitney U 检验,结果见表2:两次评论的秩均值高于一次性评论,M一次评论=12663.703
对追评效价不同的两次评论感知有用性进行比较,发现M追评为正=3139.392
将每组评论的初评和追评作为一个配对,使用Wilcoxon 带符号秩检验。由表4可知,当初次评论和追加评论均为正向时:正秩=2273>负秩=1575,p=0.000,在0.001的显著性水平下显著。对于“初正追正”的两次评论,追评的情感强度强于初评的情感强度,H3a得证。当初次评论和追加评论均为负向时:正秩=591>负秩=342,p=0.000,在0.001的显著性水平下显著。这表明对于“初负追负”的两次评论,追评的情感强度强于初评的情感强度,H3b得证。综上,可以得到对于一致型两次评论来说,消费者在追加评论时一般表现出更强的情感强度。
由表5可知,当初次评论为正向、追加评论为负向时,负秩=499>正秩=398,p=0.000,在0.001的显著性水平下显著。H3c得证,表明对于“初正追负”的两次评论来说,追评的情感强度大于初评。当初次评论为负向、追加评论为正向时,正秩=273>负秩=210,p=0.005,在0.05的显著性水平下显著。H3d得证,表明对于“初负追正”的两次评论来说,追评的情感强度小于初评。
2.4.4 追加评论时间间隔比较
对于搜索品和体验品的追加评论时间间隔特征进行检验,结果见表6:时间间隔的秩均值MU盘=3315.80>M洗面奶=3176.95,且p=0.003,在0.05的显著性水平下显著。H4得证,表明搜索品追加评论的时间间隔要显著长于体验品。
3 结论
3.1 研究结论
本文通过采集京东商城的真实评论,使用自然语言处理技术对在线评论进行效价分类和情感强度测量。研究发现:相比较于一次性评论,消费者对于两次评论的感知有用性更强。此外,以两次评论为研究重点,探究了初评和追评在效价、情感强度、时间间隔维度上的不同组合对评论感知有用性的影响。
关于情感效价的研究,将追加评论按照追评的方向分为“追评为正”和“追评为负”,结果显示消费者对于负向追评类的感知有用性大于正向追评类的感知有用性,该分类方法虽与王长征等学者不同,但是验证了王翠翠眼动实验的结果。通过不同效价组合的初评和追评情感强度比较发现:一致型追加评论“初正追正”和“初负追负”组中,追评的情感强度大于初评;而对于矛盾型追加评论,“初正追负”组追评的情感强度大于初评;“初负追正”组的追评的情感强度小于初评。对不同类型商品的追评时间间隔研究发现:搜索品两次评论的时间间隔要显著长于体验品;且对于体验品来说,时间间隔较短的两次评论的感知有用性强于时间间隔较长的两次评论;而对于搜索品来说,时间间隔较长的两次评论的感知有用性强于时间间隔较短的两次评论。 3.2 理论意义和实践意义
以往研究大多聚焦于一次性评论,本文对追加评论提出的新观点是对现有研究的有益补充。在研究方法方面,以往对在线评论感知有用性的研究大致采用两种方法,一种是通过量表来测量被试在不同评论环境中的感知有用性;另一种是使用爬虫技术爬取真实评论,将感知有用性作为因变量构建回归模型,探究相关因素的影响是否显著。本文结合了两种方法,数据来源于爬虫技术爬取的真实评论,感知有用性的研究使用非参数检验的秩均值比较,这是对感知有用性探究方法的补充。另外,本文并没有自建词库赋值进行情感分析,而是调用百度AI开放平台的自然语言处理,一方面简化了研究步骤并降低了研究难度,另一方面使用国内最先进的商用语言处理平台,更加适用于本文对象,大大提高了情感分析的准确性。
研究结果显示追加评论比一次性评论的感知有用性更高,因此商家不仅仅要鼓励消费者发表评论,更要在消费者购买一定日期之后通过优惠券激励等方式鼓励消费者发表追加评论。一般来说,商家在鼓励追加评论时并没有要求追评的时间,所以只是为了得到奖励的消费者在初次评论之后就立即追加评论,而这种评论感知有用性是不高的。通过本文可以发现对于搜索品,消费者对于时间间隔较大的追评感知有用性更高,而对于体验品正好相反。商家应该根据商品生命周期等因素,在消费者初评之后的特定时间段通过短信等方式引导消费者给出积极追加评价,例如引导洗面奶的追评可以在初次评论的20天以内,而U盘追评在初评的30天以后。商家应该在消费者可能发表评论的期间与消费者保持密切沟通,避免消费者给出负面评价。无论是初评还是追评出现负面信息,都会很快抓住消费者的眼球,降低消费者的购买意愿。因此,商家应该坚决避免出现初次评价和追加评价均为负向的评价。在初次评论为负向之后,商家应该通过补偿等方式安抚消费者,避免消费者情绪恶化,给出情感强度更激烈的负向追评。如果提升了消费者售后满意度,并鼓励消费者将售后处理的满意度详细体现在追加评论中,无疑是一个加分项,会对商品口碑起到积极作用。同时,商家也应该利用大数据分析方法实时监测消费者口碑动态,做到及时发现问题并处理。
对于消费者来说,在浏览在线评论的时候应该要着重关注诊断性信息较多的追加评论,对于前后情感倾向矛盾的追加评论更要重点浏览。目前主流电商平台都有对评论点赞询问的功能,评价发布者可以看到并回复。如果消费者想了解更多追加评论中出现的细节,可以浏览评论区回复,或者直接评论请求楼主回答。
3.3 研究局限和未来展望
本文仍存在一定局限性:在样本数量上,由于目前主流电商网站均设有反爬虫机制,导致收集到的评论信息数量不够大。为此,本文共选取10种U盘和10种洗面奶来提高数据规模,在提高数据量的同时也忽略了不同类型产品评论之间可能存在的整体差异,后续研究可以继續扩大研究的商品种类和数据体量。此外,本文对情感强度的研究不够具体,后续可以将效价和情感强度组合进行细化研究。
本文对商品类型的分类采取搜索品和体验品,在消费者研究领域还有享乐品&实用品、高卷入度&低卷入度、社会距离远&近等维度,在后续研究中可以对商品类型进一步细化。此外,本文在数据收集阶段发现,初评默认好评的追加评价也占比较大,这种评论的感知有用性甚至大于“初正追正”的两次评论,也值得学者关注。
参考文献:
[1] 中国互联网络信息中心(CNNIC). 2015 年中国网络购物市场研究报告[R]. 2016.
[2] 淘宝.淘宝网评价规范[R]. 2015.
[3] 王长征, 何钐, 王魁. 网络口碑中追加评论的有用性感知研究[J]. 管理科学, 2015, 28(3):102-14.
[4] 石文华, 龚雪, 张绮, 等. 在线初次评论与在线追加评论的比较研究[J]. 管理科学, 2016, 29(4):45-58.
[5] 石文华, 王璐, 绳娜, 等. 在线初次评论与在线追加评论对商品销量影响的比较研究[J]. 管理评论, 2018, 30(1):144-53.
[6] 李琪, 任小静. 矛盾性追加评论对感知有用性的影响效应研究[J]. 管理科学, 2017, 30(4):139-50.
[7] HERR P M, KARDES F R, KIM J. Effects of word-of-mouth and product-attribute information on persuasion:an accessibility-diagnosticity perspective[J]. Journal of Consumer Research, 1991, 17(4):454-62.
[8] LACZNIAK R N, DECARLO T E, RAMASWAMI S N. Consumers’ responses to negative word-of-mouth communication:an attribution theory perspective[J]. Journal of Consumer Psychology, 2001, 11(1):57-73.
[9] JIN L, HU B, HE Y. The recent versus the out-dated:an experimental examination of the time-variant effects of online consumer eeviews[J]. Journal of Retailing, 2014, 90(4):552-66.
[10] CHEN Z, LURIE N H. Temporal contiguity and negativity bias in the impact of online word of mouth[J]. Journal of Marketing Research (JMR), 2013, 50(4):463-76. [11] 卢向华, 冯越. 网络口碑的价值——基于在线餐馆点评的实证研究 [J]. 管理世界, 2009(7):126-32.
[12] 龚诗阳, 刘霞, 赵平. 线上消费者评论如何影响产品销量?——基于在线图书评论的实证研究 [J]. 中国软科学, 2013(6):171-83.
[13] GHOSE A, IPEIROTIS P G. Designing novel review ranking systems:predicting usefulness and impact of reviews; proceedings of the International Conference on Electronic Commerce, F, 2007 [C].
[14] RACHERLA P, FRISKE W. Perceived ‘usefulness’ of online consumer reviews:an exploratory investigation across three services categories[J]. Electronic Commerce Research & Applications, 2012, 11(6):548-59.
[15] SCHUFF D. What makes a helpful online review? a study of customer reviews on amazon.com[J]. Social Science Electronic Publishing, 2012, 34(1):185-200.
[16] FORMAN C, GHOSE A, WIESENFELD B. Examining the relationship between reviews and sales:the role of reviewer identity disclosure in electronic markets[J]. Information Systems Research, 2008, 19(3):291-313.
[17] PAVLOU P A, FYGENSON M. Understanding and prediction electronic commerce adoption:an extension of the theory of planned behavior[J]. MIS Quarterly, 2006, 30(1):115-43.
[18] SCHLOSSER A E. Source Perceptions and the persuasiveness of internet word-of-mouth communication[J]. Advances in Consumer Research, 2005, 32(1):202-203.
[19] 楊亮,林原,林鸿飞. 基于情感分布的微博热点事件发现 [J]. 中文信息学报, 2012, 26(1):84-91.
[20] 蔡淑琴, 秦志勇, 李翠萍, 等. 面向负面在线评论的情感强度对有用性的影响研究 [J]. 管理评论, 2017, 29(2):79-86.
[21] 徐琳宏, 林鸿飞, 潘宇, 等. 情感词汇本体的构造 [J]. 情报学报, 2008, 27(2):180-5.
[22] NAN H, LING L, JIE J Z. Do online reviews affect product sales? The role of reviewer characteristics and temporal effects [J]. Information Technology & Management, 2008, 9(3):201-14.
[23] GODES D, MAYZLIN D. Firm-created word-of-mouth communication:evidence from a field test [J]. Marketing Science, 2009, 28(4):721-39.
[24] GARBARINO E, STRAHILEVITZ M. Gender differences in the perceived risk of buying online and the effects of receiving a site recommendation[J]. Journal of Business Research, 2004, 57(7):768-75.
[25] 杜学美, 丁璟妤, 谢志鸿, 等. 在线评论对消费者购买意愿的影响研究 [J]. 管理评论, 2016, 28(3):173-83.
[26] MAN Y C, LUO C, SIA C L, et al. Credibility of electronic word-of-mouth:informational and normative determinants of on-line consumer recommendations[J]. International Journal of Electronic Commerce, 2009, 13(4):9-38.
[27] 闵庆飞, 覃亮, 张克亮. 影响在线评论有用性的因素研究[J]. 管理评论, 2017, 29(10):95-107.
[28] MUDAMBI S M, SCHUFF D. What makes a helpful online review? a study of customer reviews on amazon.com[M]. 2010.
[29] 张艳辉, 李宗伟. 在线评论有用性的影响因素研究:基于产品类型的调节效应[J]. 管理评论, 2016, 28(10):123-32.
[30] 李琪, 任小静. 消费者对不同平台类型正面在线评论感知有用性的差异研究[J]. 经济问题探索, 2015(10):41-7.
[31] GOLDSMITH R E, HOROWITZ D. Measuring motivations for online opinion seeking[J]. Journal of Interactive Advertising, 2006, 6(2):1-14.
[32] DELLAROCAS C, ZHANG X, AWAD N F. Exploring the value of online product reviews in forecasting sales:The case of motion pictures[J]. Journal of Interactive Marketing, 2007, 21(4):23-45.
[33] SUNDARAM D S, MITRA K, WEBSTER C. Word-of-mouth communications:a motivational analysis[J]. Advances in Consumer Research, 1998, 25(1):527-531.