论文部分内容阅读
由于互联网技术的飞速发展和全球消费模式的改变,人们对所购买产品或服务进行评论已成为常态,而评论对人们的购买决策、投票、产品设计等行为的影响也与日俱增,这导致虚假评论发布者给竞争对手的产品留下差评或给自己的产品发布好评已成为—种常见的做法。虚假评论可能会歪曲观点从而制造舆情,降低评论系统的可信度。然而,仅依靠人工观察来完成虚假评论的识别是不现实的,亟需一种方法使计算机对海量评论数据进行统计分析,进而判断评论是否真实,由此,虚假评论检测应运而生。但是已有虚假评论检测研究未能充分考虑多个实体中评论的时序特征、无法有效融合不同实体中独立的文本和行为特征,以及冷启动条件下检测效果较差。针对上述问题,本文利用深度神经网络对虚假评论检测展开了深入研究,主要研究成果如下:(1)提出了一种基于长短期记忆神经网络多实体特征融合的虚假评论检测方法。针对目前虚假评论检测工作忽略了用户或产品实体中评论在时间上的相关性,而导致检测性能较差的问题,提出了一种融合用户实体和产品实体的行为特征、文本特征以及时序特征的虚假评论检测方法。首先,根据专家知识提取单条评论的行为特征,并利用卷积神经网络学习该评论的文本特征;然后,将每条评论的行为特征和文本特征进行融合,训练基于长短期记忆神经网络的模型用于学习评论在用户和产品多个实体中的时序特征;最后,使用学习到的时序特征训练分类器,从而判断待检测评论是否为虚假评论。实验结果表明,该方法能有效提取具有历史活动信息的时序特征,并能联合分析多个实体的活动轨迹,显著提高了虚假评论检测的准确性。(2)提出了一种冷启动环境下基于图卷积神经网络多实体特征融合的虚假评论检测方法。针对现有虚假评论检测工作无法充分利用用户之间存在的关联信息,从而导致不能有效解决冷启动环境下特征缺乏的问题,提出了一种新的冷启动虚假评论检测方法。首先,提取每个实体的行为特征和所有评论的文本特征,并根据用户对产品进行评论这一活动将用户实体与产品实体进行关联,以用户实体和产品实体作为节点构建异构图;然后,利用图卷积神经网络学习已构建异构图中节点的共享行为特征,从而丰富冷启动用户的行为特征;最后,融合共享特征、评论文本特征与实体行为特征构建分类器,实现冷启动环境下的虚假评论检测。实验结果表明,基于图卷积神经网络学习的共享特征有效的改善了冷启动用户行为特征信息缺失的问题,与已有方法相比,提升了冷启动环境下虚假评论的检测性能。