论文部分内容阅读
随着Web2.0技术的迅速发展,开放交互的共享性网络逐渐取代了单一的门户型网站。通过各种网络平台发表自己的评论和看法已成为人们生活中不可缺少的一部分。例如在淘宝网、当当网等电商网站中,消费者在购买商品后可以进行评分以及写出对商品质量和商家服务的感受,同时,消费者之间也可以互相提问点赞。在现有电子商务体系下,拥有较高好评率的商家会得到优先展示。同时,由于差评无法被商家删除,其带给潜在消费者的恶劣印象影响深远,消费者在阅读差评后很可能会放弃之前购物的想法,反之拥有极高好评率的商品更容易成为消费者优先选择的对象。因此,在线商品的销售与商品评价信息密切相关,越来越多的商家为了经济利益开始雇佣甚至充当虚假评论者对商品进行不切实际的评论,主要分为两种情况:一种是给予自家商品夸大产品质量的好评,另一种是通过差评打击竞争对手。这两种情况导致用户无法得到商品质量的客观信息,影响消费者在购物时对商品质量的正确判断,最终使得用户无法得到满意的购物体验。面对复杂的电子商务网络环境,寻找出一种科学有效的办法去检测虚假评论或虚假评论者,是近些年来国内外诸多学者专家试图解决的问题。本文从有监督学习的角度,对评论者可能存在的作弊行为开展研究讨论,并提出了基于证据理论的虚假评论者检测方法,具体如下:1)本文结合现今电子商务平台中广泛存在的虚假评论,对虚假评论者行为动机进行分析,并根据实际情况对虚假评论者采用的多种作弊手段进行总结,建立多组指标对虚假评论者进行检测。2)本文提出将评论者可能存在的多种作弊行为视为证据体并构建D—S证据理论模型。同时借助支持向量机模型在单特征识别模式下对虚假评论者进行检测,进一步利用sigmoid函数拟合的方式为证据理论模型下单个证据体提供可信度赋值。3)本文以爬取的亚马逊中国电商网站的评论者真实数据作为测试数据集,结合人工标记的方法,对所构建模型的准确率、召回率等指标进行了测试,并同单一证据体下的检测效果进行了比较。