论文部分内容阅读
随着第二代互联网以及电子商务的发展,电子商务模式从传统的以商家为主导的电子商务模式转变为以消费者为主导的社会化电子商务模式。在以消费者为主导的模式下,消费者不再被动地接收商家提供的信息,而是通过撰写评论分享他们的购物体验,传播产品口碑。在线评论作为产品网络口碑的一种重要载体对商家和潜在的消费者都有着重要的作用。然而海量、多样的评论数据给用户带来了严重的信息过载,使得商家和消费者很难利用纷繁复杂的数据在短时间内做出理性判断。如果能从大量评论数据中挖掘出产品的网络口碑,则可提高他们的决策效率和准确率。
为解决这一挖掘问题,本文从挖掘方法和挖掘数据两个层面展开研究。在方法层面,针对现有挖掘方法信息利用不充分的不足,提出了一种集成多种异构评论数据的产品网络口碑挖掘方法,旨在提高网络口碑挖掘结果的准确性。在数据层面,为使所挖掘的网络口碑更具可靠性,本文对提高评论数量的管理策略进行了研究。首先,分析了已购产品的评论密度,研究结果反映了消费者反馈产品或服务信息的参与度或活跃度,商家可据此制定相应的奖励策略以鼓励更多的消费者在购买产品后去撰写评论,以此来提高用户的参与度。再者,通过产品零售价格对评论数量影响关系的研究,发现了不同零售价格下评论数量的变化规律,这一研究结果为商家制定价格调整策略,刺激消费者改变评论行为提供了科学依据,而更多评论数据的生成,也为网络口碑的挖掘提供了充分的数据支持。
论文的主要研究工作总结如下;
(1)基于异构评论数据的产品网络口碑挖掘方法。提出了一种可集成多种异构评论数据(包括数字评级、文本评论和对比投票)的产品网络口碑挖掘方法,该方法提高了网络口碑挖掘结果的准确性。在深入考察在线评论数据内在特性的基础上,将其分为描述信息和对比信息两大类别,提出了一个有向加权图模型用以集成这两类信息。基于图模型,提出了一种新的产品网络口碑量化算法,采用迭代算法求解网络口碑的总分值,理论证明该算法收敛。本文在第三方评论网站上进行实验数据收集,基于真实评论数据所做实验的结果表明,本文方法在基于口碑分值的产品排序结果中,与其他方法相比,其准确率最高。此外,本文还设计了基于口碑分值的产品排序系统的实现框架并开发了原型系统,展示了该方法在实际应用中的可操作性,为辅助商家以及消费者快速且准确地制定决策提供了一个可视化的途径。
(2)产品的评论密度及其变化趋势。考虑到较大的评论数量是获得可靠网络口碑的保障,本文基于构建的评论数量与购买数量的关系模型,对已购产品的评论密度状况进行了细致的研究,给出了不同产品的评论密度情况。对于评论数量与购买数量关系的建立,提出了数据驱动的关系模型的构建思路,采用符号回归方法从真实数据中智能地学习出评论数量与购买数量的关系模型。针对所发现的关系模型,根据模型的不同性能,提出了两种模型选择策略。最后基于二选定的天系模型,分析了不同产品的评论密度分布,以及评论密度的变化趋势。研究结果发现样本中60%的产品,其评论密度不是稳定不变的,当产品的购买数量较少时,评论密度相对较高,而购买数量较大时,评论密度会相对较低。该研究结果为商家通过合理的奖励机制刺激更多的消费者购买产品后发表评论提供了数学模型和决策依据,大量的评论数据为挖掘真实、客观的产品网络口碑提供了保障。
(3)价格对评论数量的影响关系。为发现产品价格变化对消费者评论行为的影响作用,本文利用数据解析方法,建立了产品零售价格与评论数量的关系模型,基于真实数据的实验结果发现,评论数量与价格之间存在单调递减、不对称U型,不对称倒U型等复杂的关系。还发现了不同产品种类零售价格的改变与评论数量变化的差异。实验结果显示,零售价格的上涨并不总是会导致消费者评论的数量或平均数字评级下降,对于样本中38%的产品,当价格增加到一定水平时,评论的数量将随着价格的上升而增加。这些发现为商家通过价格调整机制改变消费者评论行为提供了客观依据。更多的消费者所撰写的评论是获得可靠网络口碑的数据基础。
(4)设计了一个网络口碑生成、挖掘和传播模式。本文通过对基于评论大数据的产品网络口碑挖掘研究,从设计科学的角度,在现有的社会化电子商务模式的基础上,设计了一个网络口碑生成、挖掘和传播模式,提高了目前在线评论系统的有效性。该模式不仅可以促进更多的在线评论的生成,同时还克服了评论数据过载给用户带来的决策障碍,用户不用花大量的时间阅读评论,而是基于产品网络口碑的挖掘结果,快速地评估产品或服务质量,提高决策效率。此外,这一模式还有助于平台传播和推送产品的网络口碑,帮助消费者和商家快速制定正确的决策,增加用户粘性,促进电商行业健康、高效的可持续发展。
为解决这一挖掘问题,本文从挖掘方法和挖掘数据两个层面展开研究。在方法层面,针对现有挖掘方法信息利用不充分的不足,提出了一种集成多种异构评论数据的产品网络口碑挖掘方法,旨在提高网络口碑挖掘结果的准确性。在数据层面,为使所挖掘的网络口碑更具可靠性,本文对提高评论数量的管理策略进行了研究。首先,分析了已购产品的评论密度,研究结果反映了消费者反馈产品或服务信息的参与度或活跃度,商家可据此制定相应的奖励策略以鼓励更多的消费者在购买产品后去撰写评论,以此来提高用户的参与度。再者,通过产品零售价格对评论数量影响关系的研究,发现了不同零售价格下评论数量的变化规律,这一研究结果为商家制定价格调整策略,刺激消费者改变评论行为提供了科学依据,而更多评论数据的生成,也为网络口碑的挖掘提供了充分的数据支持。
论文的主要研究工作总结如下;
(1)基于异构评论数据的产品网络口碑挖掘方法。提出了一种可集成多种异构评论数据(包括数字评级、文本评论和对比投票)的产品网络口碑挖掘方法,该方法提高了网络口碑挖掘结果的准确性。在深入考察在线评论数据内在特性的基础上,将其分为描述信息和对比信息两大类别,提出了一个有向加权图模型用以集成这两类信息。基于图模型,提出了一种新的产品网络口碑量化算法,采用迭代算法求解网络口碑的总分值,理论证明该算法收敛。本文在第三方评论网站上进行实验数据收集,基于真实评论数据所做实验的结果表明,本文方法在基于口碑分值的产品排序结果中,与其他方法相比,其准确率最高。此外,本文还设计了基于口碑分值的产品排序系统的实现框架并开发了原型系统,展示了该方法在实际应用中的可操作性,为辅助商家以及消费者快速且准确地制定决策提供了一个可视化的途径。
(2)产品的评论密度及其变化趋势。考虑到较大的评论数量是获得可靠网络口碑的保障,本文基于构建的评论数量与购买数量的关系模型,对已购产品的评论密度状况进行了细致的研究,给出了不同产品的评论密度情况。对于评论数量与购买数量关系的建立,提出了数据驱动的关系模型的构建思路,采用符号回归方法从真实数据中智能地学习出评论数量与购买数量的关系模型。针对所发现的关系模型,根据模型的不同性能,提出了两种模型选择策略。最后基于二选定的天系模型,分析了不同产品的评论密度分布,以及评论密度的变化趋势。研究结果发现样本中60%的产品,其评论密度不是稳定不变的,当产品的购买数量较少时,评论密度相对较高,而购买数量较大时,评论密度会相对较低。该研究结果为商家通过合理的奖励机制刺激更多的消费者购买产品后发表评论提供了数学模型和决策依据,大量的评论数据为挖掘真实、客观的产品网络口碑提供了保障。
(3)价格对评论数量的影响关系。为发现产品价格变化对消费者评论行为的影响作用,本文利用数据解析方法,建立了产品零售价格与评论数量的关系模型,基于真实数据的实验结果发现,评论数量与价格之间存在单调递减、不对称U型,不对称倒U型等复杂的关系。还发现了不同产品种类零售价格的改变与评论数量变化的差异。实验结果显示,零售价格的上涨并不总是会导致消费者评论的数量或平均数字评级下降,对于样本中38%的产品,当价格增加到一定水平时,评论的数量将随着价格的上升而增加。这些发现为商家通过价格调整机制改变消费者评论行为提供了客观依据。更多的消费者所撰写的评论是获得可靠网络口碑的数据基础。
(4)设计了一个网络口碑生成、挖掘和传播模式。本文通过对基于评论大数据的产品网络口碑挖掘研究,从设计科学的角度,在现有的社会化电子商务模式的基础上,设计了一个网络口碑生成、挖掘和传播模式,提高了目前在线评论系统的有效性。该模式不仅可以促进更多的在线评论的生成,同时还克服了评论数据过载给用户带来的决策障碍,用户不用花大量的时间阅读评论,而是基于产品网络口碑的挖掘结果,快速地评估产品或服务质量,提高决策效率。此外,这一模式还有助于平台传播和推送产品的网络口碑,帮助消费者和商家快速制定正确的决策,增加用户粘性,促进电商行业健康、高效的可持续发展。