基于DBN模型的电子商务虚假评论识别

来源 :安徽财经大学 | 被引量 : 0次 | 上传用户:jacobyuanwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着我国电子商务产业的快速发展,人们对于网上购物的依赖程度也越来越大。年轻消费者对于消费的习惯和认识早已不再是单纯的线下购物,现如今线上购物已经成为大多数年轻人购物的首选方式,他们享受着这种便捷的购物体验。然而,我国现阶段电子商务市场发展仍存在一些严重的问题,如由于电子商务市场本身的特点导致其进入门槛低,大量商铺良莠不齐;店家与消费者信息不对称导致的交易争端亦屡有发生;交易过程的时间空间相隔绝导致信息获取不全面;物流和商流隔绝导致整个交易涉及多个行业利于舞弊等。当前,与我国电子商务蓬勃发展相对应的是与之相匹配的网络交易诚信体制并未完全建立和完善。这就导致了一些不法商家利用电子商务市场的这一特点大量刷单,从而提高自己的店铺信用分和自己商品的销售量的行为发生。这些虚假信息严重影响了人们的购买决策,给社会和市场带来的是极其恶劣的影响。虚假交易特别是虚假好评的识别有利于消费者个人提高自我识别能力,节约成本;有利于维护和规范化电子商务行业健康发展。本文在对国内外一系列网络交易虚假评论识别研究成果的整理和梳理的基础上,分析了商家刷单从产生到具体实施的整个过程和交易特点。并依据这些特点,首先利用分布式爬虫技术获取的大量产品评论,并就手中预先掌握的部分刷客信息作对比;其次从大量商品评论中挖掘出刷单数据并对数据集进行了标注;然后以产品评论的特征集作为切入点,使用了基于深度学习的深度置信网络算法分析和识别电商交易结果即商品评论的可信程度;最后通过验证模型的准确性并对比其他浅层机器学习算法,发现深度置信网络对于评论数据的识别准确率显著高于其他浅层机器学习算法,并根据模型识别的结果分析了正常消费者的评论特征。本文的主要贡献在于:(1)以商品评论数据为突破口,挖掘消费者商品评论的语言特征。以评论数据作为突破口,可以有效刻画消费者评论数据的语言特点,并期望从中发现正常消费者在评论商品时的语言特征。(2)基于深度置信网络算法,能够有效识别电子商务虚假评论。以往研究多使用计算机模拟虚假评论的发生,本文使用了基于python的爬虫技术获取海量真实用户评论数据,并运用深度置信网络算法识别刷单评论。
其他文献
我国是一个农业大国,农业发展在我国经济发展中起着关键性作用,所以发展农业经济是拉动我国经济增长的有效手段。要想在新形势下快速发展我国农业经济,就要加强我国农机服务
对211例应用Amplatzer封堵器进行房间隔缺损(ASD)封堵术的患儿进行回顾性分析,其中8例在术中或术后随访中发生并发症:脑空气栓塞1例,冠状动脉空气栓塞1例,肺空气栓塞1例,心包填塞1例
云南农村地区先天的地理劣势长期阻碍着当地教师群体专业的持续发展,为使农村教师摆脱自我提升难的困境,本文提出利用移动网络的时空跨度优势和移动终端灵活便捷特性,通过微
研究电动式耳机非线性及其改进方法。通过测量音圈峰值位移来判定电动式耳机的非线性,并根据其测量结果设计相应的实验方案降低电动式耳机的失真。实验表明,测量和改进电动式
综合思维是地理核心素养的重要组成部分。综合思维的培养需要闻道在先,提升教师的自我综合思维意识;需要以学生为主体,提供给学生更多的参与机会;需要多端思维,养成发散思维
在近年来的各地中考试卷中,涌现出一大批语文、数学、英语互相渗透、相互交叉的综合新题型,由于这类试题格调清新、设计优美、个性独特、富有创意,因此对于考查学生适应新问题、
在计算机技术的快速发展的时代背景下,金税工程和企业的信息化建设得到了极大的发展。面对当前形势,传统的增值税审计方式已经不能完全满足信息化条件的下审计工作需求。计算
与其它不同养殖动物相同,羊这一家畜在养殖过程中,也容易受到不同因素影响,受到内部因素和外部因素影响,导致其在养殖期间出现不同疾病,如果羊一旦患有疾病,没有合理的管理方
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
学前教育事业需要制度的保障,这种类型的教育关系到整个社会的利益,完善我国学前教育管理体制有很大的现实需要,因为学前教育关系到未来的教育事业,而且管理体制的问题对教育