基于异构图嵌入的虚假评论群组检测方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:C12sdn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前在电商平台中虚假评论行为正由个体行为逐渐转变为群体行为,群体行为是由一组用户通过相互协作的方式对目标产品进行虚假评论。相比个体行为,群体行为具有更高的破坏性,会对电商平台造成更大的危害。而当前针对虚假评论群组的检测方法主要是采用基于频繁项挖掘的方法,但是只能检测出紧密耦合群组;或者是采用基于评论结构检测方法,但是只能提取出直接关联特征,在提取间接关联特征上能力有限,从而导致检测精度不足。本文针对已有的虚假评论群组检测方法检测精度不足且不能提取更为准确的间接关联特征问题,进行了一些有效的研究。首先,为了解决已有的虚假评论群组检测方法由于缺少对用户间接关联特征的提取,从而导致检测精准度下降的问题。本文对异构图嵌入进行研究来检测虚假评论群组。该方法先根据评论关联性,构建用户产品关系异构图;构图后,利用异构图嵌入网络表示学习技术,学习用户产品关系异构图中的每个用户节点的评论特征,挖掘出用户之间的间接关联性,并根据每个用户的评论特征生成评论特征向量;生成向量后,使用聚类算法对每个用户的评论特征向量进行聚类,将评论特征较为接近的用户划分到同一个团体,从而生成候选群组;在生成候选群组后,利用虚假评论群组独有特征生成对应的检测指标来识别候选群组,完成对虚假评论群组的检测。其次,传统基于评论行为的虚假评论群组检测方法由于需要对评论数据进行频繁项挖掘。所以,该类方法对检测数据集有一定的紧密度要求。从而,该类方法对普通真实数据集检测只能发现紧密耦合群组。因此,该类方法在检测精准度上具有一定的局限性。为了突破这种局限性,本文对异构图分解进行研究。该方法同样根据评论关联构建用户产品关系异构图。构图完成后,对用户关系异构图进行分解,分解出用户关系同构图;并利用同构图嵌入网络表示学习技术,针对每个用户的评论行为生成用户评论特征画像。同时,以用户评论特征画像为依据并利用K-means++聚类算法将评论特征画像较为接近的用户划分到同一个候选群组;生成候选群组后,利用多种虚假评论群组特征生成检测指标来识别候选群组,从而检测出虚假评论群组。最后,为了验证本文提出的方法的有效性,在AMAZON和Yelp NY数据集上进行了实验,并和已有的一些虚假评论群组检测方法进行了对比。
其他文献
学位
文章旨在研究明挖现浇隧道中大体积混凝土开裂的风险评估及控制方法,有效控制大体积混凝土开裂的风险,提高隧道工程的质量和安全性,通过从原材料选择、大体积混凝土抗裂性技术指标及参数等方面对抗裂性评估的方法进行了论述,得出结论;介绍了低温升、低收缩混凝土的制备及相关指标控制方法,以确保混凝土的质量;提出了隧道侧墙部位大体积混凝土作业施工控裂的施工工艺措施,应用于实体结构工程中,取得了良好效果。
期刊
单幅图像去雨任务作为计算机视觉任务领域中的重要组成部分,在目标跟踪、无人驾驶等视觉任务中都承担着重要的作用。因此,在多样的计算机视觉任务中,如何在单幅图像中高效地获取更好的去雨效果成为单幅图像去雨任务中的关键问题,同时也是计算机视觉领域中一个亟待解决的难题。通过深入分析国内外单幅图像去雨方法的研究现状,同时结合深度学习思想及计算机视觉的相关知识,对如何在单幅图像中高效地获取更好的去雨效果进行了深入
学位
随着人工智能的迅速发展,强化学习逐渐成为机器人操作技能学习研究的重点算法之一。针对在机器人操作技能学习阶段面临的周期长、成本高和效率低等诸多难题,设计出具备一定自主决策和学习能力的机器人操作技能学习算法成为机器学习研究的重中之重。本文针对机械臂抓取与放置(Pick-and-place,PAP)操作技能学习问题展开研究,在综合分析国内外研究现状的基础上,结合强化学习算法并加以改进,基于此设计更加有效
学位
项目后评估在项目整个生命周期中发挥着越来越重要的作用,也越来越引起人们的重视。经过几十年的发展,在中国也取得了许多理论研究成果,并被广泛应用开来。本研究主要针对黄骅港储煤筒仓项目后评估问题,构建项目后评估体系,应用灰色聚类法对该项目进行后评估。首先,介绍了项目后评估的概念及作用;接着阐述了项目后评估的发展历程及项目后评估的一般程序;然后系统全面介绍了项目后评价的各种评价方法;最后阐述了项目后评估未
学位
随着社交网络的兴起,越来越多的人开始在门户网站上发表言论并抒发情感,这些带有个人主观态度的文本评论具有很大的挖掘价值。传统的文本情感分类主要是针对文本的整体情感进行判断,但是,由于文本表达的复杂性,一条文本可能包含多个实体,并且关于每个实体的情感倾向都是不同的。所以对于文本的情感倾向分析应该更加细化,更加具体到句子中的每一个情感实体。随着深度学习技术的快速发展,深度学习已经广泛应用到自然语言理解任
学位
报纸
秦三厂海水系统电动阀陆续出现较多故障,对电厂安全运行造成影响。本论文通过对海水系统电动阀故障进行具体分析,有针对性采取应对措施,提出相应的处理对策和处理方案,旨在提供一种有效的现场问题分析和解决方法。
会议
海面乳化溢油是海面环境污染的主要组成部分,如何对其进行监测是当前面临的一大难题。激光诱导荧光技术(LIF)是一种主动光学探测的技术,该技术使用激光照射海水中的荧光物质,从而激发其产生荧光。对获取的荧光信息进行分析,可以得知海水中荧光物质的含量信息。但是目前的LIF技术大多应用于油膜监测,对海面乳化溢油的研究相对较少。因此为了使LIF技术可以更好的对海面乳化溢油进行探测,本文构建了基于LIF的海面乳
学位
<正>跨境电商在降低交易成本方面具有十分重要的作用。文章将交易成本作为分析的基础,分别采用双重差分方法和固定效应模型实证检验了跨境电商对产品多样化和贸易收益的影响。结果表明,由于交易成本的降低,跨境电商贸易表现为替代了一般贸易模式的部分产品种类,并使得部分非贸易品转化为可贸易品,从而有利于进口国产品多样化的形成,增加了进口国的贸易收益。
期刊