基于评论内容与用户行为的集体虚假评论人检测

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zibu365H356
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,电子商务成了人们日常生活中不可缺少的一部分。面对各大电商网站大量可供挑选的商品,用户在决定购买之前都会查看网站上的商品评论,将前人的使用感受作为自身是否购买的依据。基于上述背景,部分不法商家开始雇佣一些人编写虚假评论,吹嘘自己的商品或诋毁他人的商品以从中获利。这些虚假评论人不仅影响用户的购物体验,更会对电商行业的发展造成一定破坏。因此,研究能够有效快速检测虚假评论的方法和系统对电商应用的健康发展具有重大意义。本文的主要研究工作如下:(1)本文首先提出了一种结合评论情感和可靠性算法(Group Spammer Detection Combining Reliability and Sentiment,GSDCRS)来检测水军群组。GSDCRS算法充分考虑了用户、评论和商品之间的相互关系,同时将其与群组用户的情感一致性有效结合。算法首先通过频繁项集挖掘算法产生一些可疑的候选群组,然后结合用户-商品图上的节点联系计算出用户、商品、评论的可靠度,并且基于水军群组情感一致性的特点挖掘出情感特征,最后在可疑的候选群组中找出水军群组。(2)考虑到现有大多数电商网站的评论系统都开始支持带图片的评论,而且带图片的评论在排序的时候通常会优先出现,更加具有影响力。因此,本文提出了一种适合支持图片评论系统的,结合评论图片的虚假评论人检测算法(Group Spammer Detection Combing Images,GSDCI)。算法主要考虑两个维度的匹配度,一是图片与评价商品的匹配度,二是图片与评论文本的匹配度。算法通过训练两个神经网络分别提取图片和文本的主要语义,然后计算两个语义之间的相似度,把这两部分特征融合到前面提出的GSDCRS算法中,从而进一步提升水军检测的效果。(3)本文基于京东电商平台自行构建数据集,并在公开的Yelp数据集以及京东数据集上验证了 GSDCRS算法和GSDCI算法的可行性和有效性,实验结果结果表明本文算法要优于其他机器学习的检测算法。
其他文献
近些年,国家不断推行教育信息化建设,在线学习平台迅猛发展,线上教学与线下教学相结合的混合式教学环境正在形成。本次课题的目标便是设计及实现一个能够较好地支持混合式教学环境的学习分析系统,帮助教师及时了解学生情况、发现学习指标间关系、研究教育理论,具有重要意义。主要研究内容如下:首先本文通过数据仓库理念,在一定程度上解决了混合式教学环境下多数据源混杂的问题,使得不同平台的多维数据可以有机融合、相互补充
物联网技术的应用已经延伸到我们日常的生产和生活,随着互联网技术的不断提高,物联网已经迎来了万物互联的时代。尽管物联网的应用领域不断扩大,但是在技术、管理以及成本等方面也面临着诸多难题。其中,无线传感器网络作为物联网中数据采集的一个重要技术,也是物联网技术研究的关键点,其通过在传感区域内部署大量的传感器设备来实时获取外部环境数据信息。在实际应用场景中,这些被随机部署在感知区域内的微型的传感器可以利用
宁夏宁东的煤炭资源丰富与陕西榆林、内蒙古鄂尔多斯共同构成我国的能源“金三角”。但在煤资源的利用和开采过程中常常伴有严重的污染问题。若要从根本上解决煤炭在利用过程中的诸多问题,就一定要从分子水平上对煤进行研究,提高煤的利用效率。有机溶剂的常温萃取作为一种破坏性低、操作便捷的方法,在探究煤结构领域表现出了其独到的优势。但传统的萃取过程主要是基于煤中的镜质组,对惰质组的萃取研究仍处于起步阶段。加之,溶剂
人工神经网络技术是人工智能领域一个重要的研究方向。随着人类对大脑认知的不断加深,人工神经网络需要在保证较高准确率的同时能更好地模拟生物大脑工作机制,而现有的两代人工神经网络无法同时满足这些特性,在此背景下提出一种新型的人工神经网络——脉冲卷积神经网络(SCNN)。脉冲卷积神经网络同时具有卷积神经网络的高准确率和脉冲神经网络的高能效性与高计算效率,由于同时具有两代人工神经网络的优点,脉冲卷积神经网络
如今,社会竞争日益激烈,员工面临的压力越来越大,组织中不乏个人利己思想,并由此衍生出的消极人际互动和行为方式逐渐呈现高发态势。其中,较为典型且普遍存在的社会阻抑因具有蓄意隐蔽性已然成为企业管理中的突出问题,不仅对员工的态度、健康和行为反应消极,甚至会对积极行为产生更强烈的影响。与此同时,“建言献策”是企业获取竞争力、保持持续健康发展不可或缺的积极行为,由此学者纷纷探讨积极人际互动对建言的促进作用,
微课的出现让传统教育方式发生了改变。微课课程时间短、形式灵活多样。这样的优势让学习者能够利用碎片化时间随时随地进行学习。这种方式十分符合现代人的学习价值观。微课是众多新兴学习和教学模式的重要组成部分。微课平台作为微课的载体,与微课的分享、交流与应用,有着密不可分的联系。论文以《ASP.NET动态网页设计》课程为例,以动机理论驱动的游戏化模型作为理论基础,从微课平台学习者需求、课程教学设计和微课平台
近些年来,多元化并购作为企业主要的外延扩张战略方式,在并购市场上所占比例越来越高,企业的决策和并购后的绩效水平会受到哪些因素的影响,一直备受学术界和实业界的关注。与此同时,在我国当前经济制度转型的过程中,经济和政治时刻处于紧密关联的状态,重点产业政策作为中央政府调控资源分配和引导产业发展方向的主要工具,对企业战略行为有着明显的影响和指导作用。多元化并购的主要目的是获取异质性资源,而重点产业政策具有
如今的信息社会正在从互联网时代迈向物联网时代,物联网技术将信息网络连接和服务的对象从人扩展到物,进而实现“万物互联”。在物联网环境下,相关的微型设备通常具有计算能力较弱、运行功耗较低的特点,从而无法应用传统的分组密码算法。为了保证物联网环境下的信息安全,密码学界提出了轻量级分组密码的概念,这种算法在分组密码的设计基础上做了简化,具有占用资源少、功耗低、效率高和易于实现等优势,可以适用于资源受限下的
随着我国经济实力的快速提升以及中华文化的广泛传播,非汉语母语中文学习者日益增多,而汉语学习的困难主要体现在以下三个方面:1)声调掌握不准。学习者很难将声调和母语进行联系学习,并且在汉语语句交流中的声调和变调难以掌握;2)文字同音多形。汉语中存在大量同音字且结构错综复杂导致难以辨认;3)词汇丰富多样。中文词汇数目庞大用法灵活导致使用出现偏误。学习者在学习过程中必然会有在手机中输入中文的需求,中文输入
近年来,随着人脸识别技术的突飞猛进及其各种实际商业应用的出现,人们的日常生活越来越多地接触到、甚至依赖于这一技术。然而,由于人脸这一生物特征识别模态天生就具有容易被泄露、被伪造和被攻击的特点,人脸识别在提供人们诸多便利性和科技感的同时,其安全性也逐渐的暴露出来。因此,设计具有防止伪造人脸攻击的人脸识别系统(即人脸反欺骗研究)就变得非常重要,成为了人脸识别信息安全的一个重要研究课题。目前的人脸反欺骗