基于文本与用户行为挖掘的虚假评论识别研究

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:TT_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电子商务网站中消费者对某一商品或商家进行的在线评论通常是决定消费者购买某一产品或服务的关键性因素之一。一些不良商家出自于自身的利益去操控这些在线评论,所形成的大量虚假评论影响了消费者的利益和电子商务的正常发展。因此检测这些虚假评论成为了一项重要的任务。本文提出了一种基于文本与用户行为挖掘的方法对虚假评论进行了识别。本文主要完成了以下工作:(1)提取了有效的虚假评论识别特征。通过分析评论的文本及其语义提取了n-gram特征、词性特征和LDA主题特征;通过分析用户的异常行为和评论、评论者、商家之间的潜在关系提取了最大内容相似度、积极评论比例、最大日评论数目、评分偏差、评分、评论文本长度、评论者频繁度和目标项相似度等特征。(2)构建了虚假评论检测模型。基于提取的特征分别构建了评论文本特征指标、评论语义特征指标、用户行为特征指标和关系特征指标等四类指标并基于SVM和XGboost分类算法构建了分类模型。(3)对模型进行了实证分析。分别设计了基于评论文本特征指标、基于评论语义特征指标、基于用户行为特征指标、基于关系特征指标和基于融合特征指标的五类分类实验。最终通过实验验证了选取特征的合理性与构建模型的有效性。本文关于虚假评论识别的研究结果,为虚假评论识别研究提供了一些新的思路与有效的识别方法,可以为虚假评论识别实践工作提供一定的理论支持。
其他文献
目的:比较电针联合透灸与生物反馈盆底肌训练治疗产后压力性尿失禁(SUI)患者的临床疗效。方法:将60例产后42天SUI患者随机分为观察组和对照组,每组30例。观察组采用电针联合
李果实味美色艳,露天条件下栽培,一般在6月上旬至8月上旬成熟。为了使李子提早成熟上市,于1997~1998年在平度市麻兰镇、云山镇进行了李树棚栽观察与试验,探索李树棚栽丰产技术,并获得成功。1扣
随着社会经济的快速发展,以及为了适应市场经济对建筑工程造价管理的需求并真实的反映工程的实际造价,因此,有效的控制工程造价具有极其重要的现实意义,以下笔者就建筑工程造价中
分析了在科技项目管理中存在的突出问题,运用现代项目管理的过程控制方法。讨论了科技项目实施阶段的过程控制机制和项目实施过程中质量、进度、经费3大目标的监督机制,提出了
目前对桃果枝的修剪,多数仍沿用传统剪法,不分品种,侧重利用中长果枝并全部实行重短截.这种剪法,对坐果率及果实的品质产量均有一定影响,需进行改进.
伴随着互联网技术的快速发展和广泛普及,尤其是Web2.0概念和技术的引入,互联网中产生了海量用户生成内容,其中就包括了电子商务中的产品评论。然而,由于互联网的开放特性以及
<正>伴随着当前国际矿产资源市场的跌宕起伏,"矿产资源战略储备"一词频频出现于各种媒体报道。矿产资源战略储备是指为保障国家安全及在国际上保持独立自主地位,由国家实施对
随着建设工程向地下延伸,深大基坑施工越来越多,周围环境越来越复杂,而由深基坑施工诱发的事故后果常常都十分严重,典型的事故就是边坡失稳坍塌。天印高级中学学生宿舍楼工程基坑
杏树不同品种,树龄,枝类及树体同藏营养水平均会影响雌蕊的败育率和坐果率,贮藏营养水平高,树龄增大,则败育率较低,坐果率高。各类枝条中,以0.3-0.5cm粗的短果树结果较好。生长调节剂较难彻底