基于文本与用户行为挖掘的虚假评论识别研究

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:TT_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电子商务网站中消费者对某一商品或商家进行的在线评论通常是决定消费者购买某一产品或服务的关键性因素之一。一些不良商家出自于自身的利益去操控这些在线评论,所形成的大量虚假评论影响了消费者的利益和电子商务的正常发展。因此检测这些虚假评论成为了一项重要的任务。本文提出了一种基于文本与用户行为挖掘的方法对虚假评论进行了识别。本文主要完成了以下工作:(1)提取了有效的虚假评论识别特征。通过分析评论的文本及其语义提取了n-gram特征、词性特征和LDA主题特征;通过分析用户的异常行为和评论、评论者、商家之间的潜在关系提取了最大内容相似度、积极评论比例、最大日评论数目、评分偏差、评分、评论文本长度、评论者频繁度和目标项相似度等特征。(2)构建了虚假评论检测模型。基于提取的特征分别构建了评论文本特征指标、评论语义特征指标、用户行为特征指标和关系特征指标等四类指标并基于SVM和XGboost分类算法构建了分类模型。(3)对模型进行了实证分析。分别设计了基于评论文本特征指标、基于评论语义特征指标、基于用户行为特征指标、基于关系特征指标和基于融合特征指标的五类分类实验。最终通过实验验证了选取特征的合理性与构建模型的有效性。本文关于虚假评论识别的研究结果,为虚假评论识别研究提供了一些新的思路与有效的识别方法,可以为虚假评论识别实践工作提供一定的理论支持。
其他文献
目的:比较电针联合透灸与生物反馈盆底肌训练治疗产后压力性尿失禁(SUI)患者的临床疗效。方法:将60例产后42天SUI患者随机分为观察组和对照组,每组30例。观察组采用电针联合
分析了在科技项目管理中存在的突出问题,运用现代项目管理的过程控制方法。讨论了科技项目实施阶段的过程控制机制和项目实施过程中质量、进度、经费3大目标的监督机制,提出了
伴随着互联网技术的快速发展和广泛普及,尤其是Web2.0概念和技术的引入,互联网中产生了海量用户生成内容,其中就包括了电子商务中的产品评论。然而,由于互联网的开放特性以及
<正>伴随着当前国际矿产资源市场的跌宕起伏,"矿产资源战略储备"一词频频出现于各种媒体报道。矿产资源战略储备是指为保障国家安全及在国际上保持独立自主地位,由国家实施对