基于卷积神经网络的虚假评论检测研究

来源 :新疆师范大学 | 被引量 : 0次 | 上传用户:xiaoF123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和电子终端技术的快速发展和应用,电子商务突飞猛进,一度颠覆了人们的购物方式。线上购物已经成为人们普遍的购物方式。很多消费者在决定是否购买物品时,除了查看商家介绍的详情,也经常查看用户的商品评论和购物体验,随之而来也产生了虚假评论问题。部分不良商家为了谋取不正当利益,雇佣一大波虚假评论师对商品盲目吹捧,对同行商家商品恶意诋毁。这种做法严重影响了电子商务平台的购物秩序,破坏了公平的购物环境,影响了消费者的购物选择和体验。虚假评论都是人为根据商家提供的商品信息刻意撰写的,具有一定的专业性和迷惑性,消费者难以辨别。因此,为了维护电子商务平台的稳定发展,急需研究一种有效识别虚假评论的可靠方法帮助消费者识别虚假评论。卷积神经网络(Convolutional Neural Network,CNN)是受生物自然认知机制启发产生的一种经典神经网络,可将评论数据映射到更高的维度进行抽象的表达,更加深入的学习评论数据存在的内部关系和规律,从而用此规律检测用户评论是否真实。针对虚假评论语料不足的状态,本文在ott黄金数据集的基础上,通过爬虫工具以亚马逊购物网站为对象,爬取了部分用户的评论对黄金数据集进行了扩充。针对虚假评论文本迷惑性大且难以识别的特点,本文提出了基于嵌入机制的卷积神经网络模型以提高虚假评论检测的性能。具体过程包括:(1)通过word2vec将原始数据训练成指定规模的词向量嵌入卷积神经网络的输入层;(2)利用卷积层和下采用层(池化层)合理的结合进行特征提取和降维,通过flatten层进行平铺;(3)送入全连接层中进行结果判别。本文采用了实验方法研究了不同层次的卷积神经网络结构训练数据,寻求最佳层次实现卷积神经网络的最佳模型。针对模型中出现的过拟合问题,及时调整相应参数以使模型效果最佳。同时将原始数据训练成不同维度的词向量送入到同一个卷积神经网络模型进行的对比实验,探讨了不同维度的词向量对卷积神经网络的影响。最后,利用训练的最佳模型,采用了扩展的黄金数据集进行了性能验证。实验结果表明,通过维度的优化和层次结构优化,以及数据集的扩展,较好地提升了卷积神经网络网络对虚假评论的识别性能。
其他文献
随着多媒体应用的不断发展,低频频段资源逐步耗尽,而人们对于传输速率和信号带宽方面的要求则日益增加,故低频频段资源已无法满足。近几年来,国际上陆续开放了60GHz频谱周围的免许可频带,使得60GHz超高速无线通信系统的传输受到各方各界的关注。而紧跟着IEEE 802.11ad等相关无线传输协议的推出,标志着超高速无线通信的研究正在继续深入,60GHz毫米波通信势必会成为一个新的研究热点。60GHz毫
本文研究有理整数环上的Menon恒等式推广.第一章,介绍了要研究问题的主要背景以及本文的主要结果.第二章,给出了本文涉及的基本概念和重要定理,为第三章的证明做铺垫.第三章,
随着科技进步和社会发展,移动机器人在许多领域得到了广泛应用,在电力巡检、智能驾驶、无人机测绘等领域发挥着重要作用。而机器人定位和建图技术(SLAM)则是对移动机器人智能
液晶作为一种具有独特物理和光学特性的材料,在现代科技中扮演着重要的角色。除了在较传统和常见的应用方向——液晶显示(LCDs)技术中的卓越表现外,液晶还有着更多在光子学方
自“特色小镇”被提及以来,其就被视为发展新型城镇化和建设新农村的催化剂,是促进经济增长和产业结构转型的推动力。纵观全国各地特色小镇的发展,几乎都是以产业为特色小镇的建设根本,产业发展的好坏直接影响着特色小镇创建培育的成功与否,因此本文以产业集聚为切入点,研究江苏省特色小镇的演化。首先,通过对特色小镇和产业集聚的相关理论研究,发现特色小镇和产业集聚两者之间存在着紧密的关系,特色小镇是产业集聚的升级版
[目的]为了研究以三法三穴为代表的推拿手法是否通过影响cAMP-PKA信号通路进而促进SNI大鼠的损伤恢复,本研究以大鼠坐骨神经损伤模型(Sciatic Nerve Injury,SNI)为例,通过利用行为学、组织形态学、分子生物学技术对大鼠坐骨神经损伤后的情况进行综合评价,观察SNI大鼠的感觉功能和神经损伤的修复情况,探究推拿的起效机制,为推拿治疗周围神经损伤提供科学依据。[方法]以SD大鼠作为
近年来,越来越多的消费者倾向于在网络上发表评论分享自己的消费体验并在作出消费决策时参考他人的评论意见。然而,一些不良商家通过伪造评论内容以达到夸大自身品牌或诋毁竞
我国运动休闲小镇建设过程中出现发展思路不清晰、规划不科学等问题,如何建设发展小镇是亟需解决的问题,而建设、完善小镇首先要从小镇发展系统的视角去考虑。为此,本研究基于旅游系统理论,运用文献资料分析法提取影响运动休闲小镇发展的重要因素,初步构建运动休闲小镇发展系统模型,并访谈10位运动休闲小镇实践或理论研究专家,对模型进行修正。在此基础上,针对浙江省运动休闲小镇的发展现实,实地考察了 4个浙江省运动休
随着无人自主系统的发展,室外无人平台的高精度导航问题越来越受到人们的关注。目前主流方案是利用高精度地图和GPS/INS完成定位和导航,但是高精度地图的构建需要有高精度的位姿信息,并且在一些特殊环境中有时候无法获取GPS信号,而且GPS的精度也不足以达到高精度建图和导航的要求,因此这时就需要借助SLAM方法来解决上述问题,一种可行的方案是利用激光雷达传感器实现无人平台的定位和高精度地图的构建。目前基
澳门与内地具有相同名称、相似职能的公文文种主要分为三大类别:知照类、请示报告类和函类。其中,两地请示和报告文种的职能基本相同,本文不做具体的分析,知照类文种的行文职能差异最为明显。因此,本文选取了同名的知照类文种进行比较研究。由于函文种的特殊性,以及使用的广泛性,本文将知照函也纳入研究范畴。比较发现,通知、通告和公告三个文种在两地的使用职能上存在很多相互重合之处,在内地使用通知行文的公文内容,在澳