基于无监督学习的虚假评论检测算法集成和评估方法

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:hldu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在日常生活中,网络购物是一种重要的购物方式,但是网络购物看不到真实的商品,用户只能通过阅读为产品编写的在线评论,以决定是否购买该产品。评论实际上影响着用户的购买决策,关联着商家的销售额,往往正面积极的评论对提高销售额是更有帮助的。因此,为了获得利益,一些商家开始雇佣水军,制造虚假评论,这些评论无关商品优劣,并不是用户对待商品真实的想法,严重影响了用户的网络购物体验。为了检测这类虚假评论,研究者已从多角度提出了许多相关方法,如基于特征的方法、基于图的方法及基于深度学习的方法等。针对这些已经提出的方法,本文提出了一种基于无监督学习的虚假评论检测算法集成及评估模型——Spam Vote,Spam Vote模型主要围绕两个问题展开。其一,为了提高整体虚假评论检测性能,集成由不同类型的、基于作弊概率的虚假评论检测算法生成的多个排序列表,创建了一个性能更好的综合排序列表。模型通过投票将多个排序列表组合在一起,鉴于虚假评论的多样性,本文使用不同类型的算法进行建模,从排序数据中学习潜在变量,以检测项目是否为作弊项目;其二,因为获取真实有标注的数据集是非常困难的,即使现在有许多的检测算法,但是没有有真实标注的数据集,很难知道在几种检测算法中,哪一个算法的性能会更好。因此,本文试图通过Spam Vote平台,比较出算法的性能,这里模型以由不同算法生成的排序列表与综合排序列表的相似性做为算法性能的评估结果。最后,本文在真实的数据集上做了大量的实验。实验结果表明,Spam Vote模型创建的综合排序列表性能以高概率优于所有参与集成的排序列表性能,算法性能的评估结果接近真实结果。
其他文献
随着科技的不断进步,相关电子元器件的制造产业取得了高速发展,自动检测电子元器件产品质量也成为了电子元器件生产的现实需要。在自动检测领域中,“检测精度”与“检测速度”是两个十分重要的检测的指标。本文根据工业生产环境中对检测精度和速度的不同需求,提出以下两种需求目标:(一)允许少量精度损失的情况下以高速度为目标;(二)以较高精度的电子元器件表面缺陷检测为目标。针对这两种需求目标,本文分别设计了两种基于
学位
交通运输是一个城市的经济命脉,城市交通系统是一个复杂、庞大的系统,具有不确定性、多变性、随机性。随着城市车辆数量的不断增加,传统的交通信号配时方案无法应对,无论国内外,每年因交通拥堵造成的多方面损失都是巨大的。而智能交通信号配时技术的出现,突破了传统交通信号配时的危机和瓶颈。近些年来,随着智能技术的发展,基于深度强化学习(DQN)的交通信号配时技术成为智能交通信号配时中的主流。基于DQN的交通信号
学位
随着计算机视觉技术飞速提升再加之社会各界大力发展,基于深度学习的行人检测与跟踪技术愈来愈受到国内外专家的科研重视,各国科研所与科技公司都对此展开了着力研究。人们对于安全与隐私意识也愈发提高,对于室内监控则变得越来越重视并在教学楼,火车站,候机楼等各种场合都有着视频进行记录,用监控学生或员工的安全问题;同时也可以在室内某些恶劣情况发生时检测人们的轨迹检测并记录下来,及时发现情况将人身和经济损失降低;
学位
随着当今社会人工智能的迅速发展,各行业对无线定位技术的需求不断增加。目前飞机机翼的装配复杂,尺寸较大,在实际的装配过程中定位难、在装配时需要大量工人协作装配,工人仅根据经验或纸张看板装配,会出现错装、漏装等情况。为了满足工人对装配资源的定位以及装配信息可视化的需求,采用基于RFID技术和UWB(超宽带)技术的复合定位方案实现状态信息的获取,以建立实时更新的、现场感强的“真实”飞机机翼模型,利用真实
学位
传统的装配辅助系统都是基于两个方向——虚拟装配辅助系统和PC端的装配辅助系统。虚拟装配辅助系统只能作为前期培训使用,并不能将装配过程与其结合,所以该技术有着较大的局限性。而基于PC端的装配辅助系统虽然也可以在装配过程中查看各种必要的信息,但是这也意味着用户必须停下手中的工序去操作电脑,这大大降低了整体的效率,同时其也存在着不够形象、晦涩难懂的缺点。本文针对以上两种装配辅助技术存在的不足和未来传统制
学位
随着现代社会不断发展,手机、电脑等电子设备已经成为人们日常生活中不可或缺的一部分,同时摄像头等设备在大街小巷发挥着重要作用。超市中,摄像头可以实时记录突发情况;教室中,摄像头可以实时的记录学生的行为活动。监控摄像头中含有大量信息,通过监控视频分析人体行为异常信息已逐渐成为了各个领域的热门话题。人体异常行为检测的研究对于室内场景下分析人体行为提供了有利条件,逐渐成为了一个重要的研究课题。所谓人体异常
学位
眼底图像中的视网膜血管是人体重要的反射区,可以根据视网膜血管的病变程度,了解其他部位的疾病。随着深度学习人工智能技术的发展,计算机技术辅助医疗疾病的诊断已成为一种趋势。本文对图像分割以及视网膜血管分割的国内外现状进行了深入的总结,介绍了深度学习视网膜血管分割相关的理论知识。目前视网膜血管分割方法还存着分割准确率不高、灵敏度较差、错误识别分割区域等问题。针对这些问题,运用深度学习方法,对视网膜血管进
学位
水声传感器网络(Underwater acoustic sensor network,UASN)作为水下物联网感知层的重要组成部分,在海洋工程监测、开发海洋资源、预防自然灾害等多个领域具有广阔的应用前景。UASN在实际应用中需要部署大量节点,并且需要节点间高效的信息交互,协同完成具体任务。因此面向UASN的分簇、路由技术成为学术界研究的热点。水声信道长时延、窄带宽、高误码率等特点,使得传统的传感器
学位
装配序列规划是机械产品装配工作中的基础环节,亦是决定装配质量的重要环节,装配序列的合理规划直接影响装配的效率和成本消耗,因此如何使装配序列规划过程更加精确与高效成为了现在制造业研究的重要问题。智能优化算法的应用为具有约束条件限制的装配序列规划问题提供了一种高效的路径寻优方法,装配仿真技术为验证装配序列的准确性提供了保障。本文以机翼为研究对象,提出了利用蚁群遗传混合算法对机翼装配序列进行优化的方法,
学位
随着无人机及其相关技术的快速发展与日渐成熟,其在军事、商业、民用等领域正扮演者越来越重要的角色。在无人机的实际应用中,往往需要众多无人机之间互相通信、相互协作共同完成复杂的任务。因此面向无人机组网的路由技术越来越受到重视,并成为当下研究的热点。由于完成任务的复杂性、网络拓扑的高动态性、无人机节点容易受到外部损伤等特点,,研究无人机组网下的拓扑、路由技术来提高数据传输的可靠性、网络抗毁性具有十分重要
学位