【摘 要】
:
电子商务的发展促使在线评论数量急剧增长,产品评论成为人们购物消费的重要参考指标,但是网络中的虚假评论却在逐年增多,其发布者多为专业的虚假评论用户群。虽然国内外研究
论文部分内容阅读
电子商务的发展促使在线评论数量急剧增长,产品评论成为人们购物消费的重要参考指标,但是网络中的虚假评论却在逐年增多,其发布者多为专业的虚假评论用户群。虽然国内外研究者提出了许多用于检测虚假评论和虚假评论者的方法和模型,但是仍存在许多问题,如人工标注数据的准确率低、语言特征失效、检测精确率较低和检测滞后。为了解决以上问题,本文主要研究在线评论网站中虚假评论用户群的检测模型,主要研究内容包含以下两个方面:1.针对人工标注数据的准确率低和语言特征失效的问题,提出一种基于派系过滤的虚假评论用户群离线检测模型,采用完全无监督的方式检测虚假评论用户群。首先,将评论数据构建为评论者网络。其次,在评论者网络中执行派系过滤算法,创新地将检测到的每一个k-派系链视为一个虚假评论用户群。然后,构建基于评论行为的作弊特征,从个人和群组两个维度衡量各个虚假评论用户群的可疑程度,生成群组排序列表。最后,在三个公开数据集上进行对比实验,结果表明本模型的检测精确率和排名质量高于四个对比模型,并且数据集越大,本模型的效果越好。2.针对检测滞后和检测精确率较低的问题,提出一种基于增量派系过滤的虚假评论用户群在线检测模型。首先,基于传统的派系过滤算法检测初始静态评论者网络中的虚假评论用户群,并通过基于行为的作弊特征生成群组排序列表。其次,提出一种增量派系过滤算法,增量式处理网络动态变化,并在线更新排序列表。然后,本模型也提供一种半监督的解决方案,通过结合部分带标记的评论数据来提高检测精确率。最后,在两个公开数据集上进行对比实验,结果表明本模型的运行时间远远短于离线检测模型。虽然检测精确率和排名质量低于离线检测模型,但是只需结合少部分带标记的评论数据,就能使检测精确率和排名质量获得显著提升。
其他文献
货币当局为实现货币政策的最终目标而制定的货币政策规则一直是经济参与者关注和政策制定者以及广大经济学者们研究的重点,西方学者通过大量实证研究将泰勒规则视为货币政策
随着金属镍需求的增长,国内企业对于金属镍生产的要求也随之提高。之前采用的人工剥离镍始极片的生产方式已经无法满足生产需要,而国内大多企业引进国外的自动剥片设备并不能适应国内的生产状况,在实际生产中出现了剥片效率低,镍始极片剥离后出现塑性变形以及由于国外的技术封锁造成了剥片设备维护麻烦且价格高昂进而增加了生产成本等问题。面对需求和生产关系的严重矛盾,对镍始极片剥片技术的研究和相关设备的研发具有重要的实
近年来,脑科疾病的患病率在逐年增加,许多研究学者开始将人工智能应用到脑科疾病的检测中。现有的基于脑电信号的癫痫识别算法(如SVM、KNN等)都需要先进行数据的预处理和特征筛选,提取的特征往往都缺乏医疗解读性,并且容易引发维度爆炸。另外,抑郁症语音的识别中,常见的MFCC、LPCC语音特征提取方法具有单一维度性,缺乏可解释性和推广性差等缺点。卷积神经网络作为一种多层神经网络,具有很强的特征自学习能力
随着我国工业化和城镇化的快速推进,人地矛盾已成为制约社会和经济发展的重要因素。宅基地有偿使用制度不仅是农村土地制度改革三项试点的重要组成部分,而且是实现土地资源节
免疫组化技术是癌症诊断的重要技术之一。基于计算机视觉的医学图像处理技术,能够帮助医生客观、快速、准确得出诊断结果,对推动医疗自动化诊断有显著作用。阳性染色所对应的
天然产物全合成在有机化学实际应用中非常重要,是有机化学专业化应用的前沿,受到化学家们的广泛关注。从自然界中分离天然产物通常受到产量及分离难度的限制,这使得人们难以
结构光测量技术是三维质量检测领域中的重要技术,该技术具有具有非接触、速度快、精度高、实时测量性能优越等优点,可以通过计算得到测量范围内的高精度三维点云模型,被广泛应用于于人脸识别、工件质量检测、三维形貌测量、运动跟踪、模式识别、逆向工程等领域。但是在对复杂增材制造件进行三维质量检测时会产生如下问题:投影仪的投影范围为矩形,而增材制造件复杂且不规则,导致测量生成的点云包含大量冗余信息;受结构光测量系
路径规划技术是移动机器人技术的研究热点。针对智能机器人在进行全局路径规划会有多个目标点的实际情况,就会有机器人路径的平衡优化问题,采用本文提出的基于反向学习的改进
通过电极间所激励的空间电场驱控液晶分子偏转来构造特定空间排布,实现微纳控光与光敏基础上的高效波前测量与调变这一方式,是近些年所兴起和快速发展的一项高效能自适应光学探测手段。电控液晶微纳控光结构以其驱控灵活、控光变换稳定可靠、功耗低、易与其他功能结构匹配耦合甚至集成等特征,显示出了日益广阔的发展前景。本文开展了基于控光用向列相液晶材料的介电特性,构建用于扩展波前测调能力的电控液晶微镜矩阵的研究。通过
删失型数据广泛存在于工程实践与管理中,对于数据驱动的物流决策方法和理论提出了新的挑战。删失型数据由于其删失机制特殊性和复杂性,致使传统的决策方法和模型难以有效处理