基于动态多模网络的虚假评论检测方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:the4eye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
web2.0技术的迅速崛起,使越来越多的用户喜欢在电商平台和点评网站上发表评论,分享他们对于产品和服务的观点和感受,这些用户发布的评论信息无论是对消费者还是商家都是至关重要的,因为这些评论包含着大量用户对产品或者服务质量的描述。但是受利益的驱使,一些不法商家通过雇佣虚假评论者发布不真实的评论来提高自己的信誉或者诋毁竞争对手的信誉,以达到误导消费者购物决策的目的。这种行为不仅误导消费者的购物决策,而且还严重影响了电子商务的健康发展,所以尽早发现虚假评论并在最大程度上减少它们的影响是刻不容缓的。近年来,虚假评论检测已经成为一个热门的研究领域。研究者常常通过分析文本极性和评分模式来发现虚假攻击,这些通用的检测方法能够轻松地检测出常规的虚假攻击,但是却很难有效识别出那些把自己伪装成真实用户的虚假评论者。传统的单一维度检测算法未能考虑多个评论特征之间的潜在影响,致使准确率不高,为此本文提出了一种基于动态多模网络的虚假评论检测算法,并进行了较为深入的研究工作。本文主要工作及创新点如下:(1)提出了一种融合动态多模网络的虚假评论探测方法。该方法首先构建了包含评论、评论者、商品和商家的四维网络;然后提出了评论忠实度、评论者信誉度、商品优质度和商家可信度概念并对其量化;紧接着使用谱聚类算法探讨了四类节点之间的联系,最后设计了一个迭代计算模型,通过迭代计算揭示了四维网络之间的动态交互影响。使用该方法可以同时准确地检测出虚假评论、虚假评论者和不良商家。(2)提出了一种基于情感强度的虚假评论检测算法,该方法主要通过自然语言处理技术分析评论文本情感极性。在本文中,我们的方法主要有以下几点创新:首先,我们使用领域词典挖掘出评论类别,并考虑了关联词对文本极性的影响;其次,本文简化了实验数据的采集与处理工作,通过分析数据发现了5个重要的虚假评论检测特征;最后,使用逻辑回归模型将5个量化后的特征融合在一起,并训练出一个有效的虚假评论分类模型。该方法是计算多模网络中评论忠实度的重要前提。(3)提出了一种改进的基于用户信誉的虚假评论检测算法。首先,使用矩阵补全理论把低秩稀疏的用户-项目评分矩阵填充,其次,构建用户信誉评估模型;最后,本文选择了更加合理的预估标准,并且细化了群组规模相同而评分不同的用户信誉,使用top-k算法判定信誉值最低的k个用户为虚假评论者。该方法对于计算多模网络的用户信誉是至关重要的。
其他文献
学位
现如今,商场越建越大,内部结构也越来越复杂,不熟悉商场环境的消费者在购物时比较费时而且不易找到合适商品,本设计以方便用户购物为目的,采用物联网技术为用户展示商场内部
随着在线社交网络飞速发展,数以亿计的用户开始在互联网上使用在线社交网络进行沟通交流。如今大型在线社交网络系统一般使用key-value的方式对用户数据进行存储,这种存储方式
学位
随着第二代基因测序技术的广泛使用,基因测序速度得到了很大地提升。随之产生了海量的生物数据,这些数据需要通过分析、整理和注释之后才能使其具有生物学含义。目前,已经有
随着近年来虚拟桌面系统和云计算技术的蓬勃发展,虚拟化技术不断成熟和完善。与此同时,虚拟化环境中的应用服务也呈现多元化,并难以预测。由于虚拟机监视器对于虚拟机上运行的应
随着企业数据库的规模越来越大,传统的数据库管理系统已经难以满足企业发展的需要。因此,利用云计算和虚拟化相关技术实现虚拟化数据管理平台,能够更好地适应企业对数据管理的新
网络媒体承载了大量的信息,尤其是多媒体信息,对于敏感的图像数据通常要求进行保护处理,这必然带来相应的信息安全问题。数据加密,便是使用计算机系统对信息进行保护从而使信息安
随着我国经济的不断发展,传统的物流业已经不能满足当前快速发展的企业需求,而现代企业已把物流当作企业之间竞争的重要力量和手段。因此,把现代物流理念、先进的物流技术和现代
随着改革开放以来商品经济的高速发展,物流业在国民经济中占有越来越重要的地位,逐步成为当前竞争最激烈的领域之一。汽车制造业的发展程度部分体现一个国家的综合国力,同时