基于协同训练的互联网在线虚假评论识别研究

来源 :北京化工大学 | 被引量 : 5次 | 上传用户:badgod
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的蓬勃发展,网上购物逐渐成为人们工作生活不可获缺的一部分。人们在进行网上消费之前,会有目的性的参考以往用户评论进行消费决策。正因为这些评论信息可以很大程度上影响消费者的购买意愿,加之在购物平台上人为的添加评论信息难度和成本都不高,部分商家会刻意的雇佣“水军”向自己的产品添加正面的评论,甚至向竞争者的产品添加负面评论。这些人为捏造的评论会误导消费者,破坏正常的网上商业秩序,因而有必要对它们进行识别和剔除,不过这些虚假评论有很强的隐蔽性,人工的方法进行识别效率很低,成本很高,准确率也难以保证。本论文针对上述问题,对互联网虚假评论分析技术进行了调研,对网商平台的虚假评论进行了研究与实验。由于基于机器学习的技术对解决该类型问题有特有的优势,故而本文提出了基于协同训练的两种虚假评论识别方法:一种将评论中所含有的词语与概率上下文无关文法进行协同即CoSpa模型,一种将评论中所含词语用信息熵的形式均分成不同的特征集进行协同即CoFea模型。在虚假评论的标准数据集上展开实验,实验结果证明,本文所提出的方法CoSpa和CoFea均比作为对比的SVM分类器有较优的识别准确率,其中CoSpa-U(90%的识别准确率)在迭代学习趋于稳定后识别准确度比CoSpa-C(85%的识别准确率)略高5%,高于用来对比的SVM分类器(75-80%的识别准确率);CoFea-T(83%的识别准确率)在迭代学习趋于稳定后识别准确度比CoFea-S(80%的识别准确率)略高3%,高于用来对比的SVM分类器(75-80%的识别准确率)。横向对比CoSpa和CoFea两种方法,前者有相对较高的识别准确率,后者有更优秀的运算速度。本文的研究为解决互联网电商在线虚假评论问题提供了前景广阔的思路和方法,将本文的研究成果加以利用可以消除互联网在线虚假评论对网上商业秩序造成的负面影响。
其他文献
目的观察对比不同臭氧水浓度联合负压吸引治疗感染性创面疗效。方法选取2015年2月~2016年1月在我院接受治疗的慢性创面患者86例,根据随机数字表法分为观察组和对照组,各43例
针对数值模拟中网格生成过程中的弊端和冗长计算时间问题,对无网格并行SPH方法研究很有必要,而最花费时间的就是粒子搜索算法。在充分研究桶搜索算法的基础上,提出单元搜索算
针对目前Web应用中存在的大量安全威胁,该文给出了一种使用可信计算技术保障Web服务器内容安全、可信的模型。该模型使用TPM(Trusted Platform Module)作为系统的可信根,通过
目的分析臭氧液联合改良负压封闭引流(VSD)治疗皮肤大面积软组织缺损的临床效果比较。方法选择2014年2月至2016年2月外伤性大面积皮肤软组织缺损患者120例,按照信封法随机分
目的探讨臭氧水冲洗在感染创面治疗中的应用,以寻求感染创面治疗的新方法,提高创面愈合质量。方法选取2014年4月至2017年10月东南大学医学院附属江阴医院烧伤整形科126例不同
本文主要就畜牧业生产过程中所产生的禽畜粪尿、恶臭气体、有机废水以及药物残留等环境污染进行了分析,并提出了一些具体的污染治理的建议,以供参考。
我国煤矿煤层自然发火非常严重,据不完全统计,我国国有煤矿自然发火危险矿井已占60%,由于煤炭自燃导致的优质煤损失量已达42亿吨以上,现在仍以每年2000~3000万吨的速度增加,每年造成
"多媒体技术"课程是高等学校计算机科学与技术专业的基础课程。针对普通高等师范类学校计算机科学与技术专业特点和生源特点,在分析"多媒体技术"课程特点的基础上,结合本人教学实际,从师范类特色教学、任务驱动法教学、实践教学等方面提出若干教学改革方法,并对教学手段的改革进行探讨。实践证明,综合灵活采用以上教学方法和教学手段对教学效果有很好的促进作用。
目的探析ICU患者突发心脏骤停原因及护理干预效果。方法选取2014年7月~2016年7月我院ICU收治的70例突发心脏骤停患者为研究对象,根据抽签法均分为两组,即对照组与观察组,各35
2006年,中国发布了自己的地面数字电视专利标准:单载波调制的ADTB-T方案和多载波调制的DMB-T方案。其中多载波调制的DMB-T方案基于正交频分复用(OFDM)技术,能有效地对抗因为无线