【摘 要】
:
由于网购接触不到商品,所以用户只能从电商平台上了解相关的产品信息,其中评论信息越来越被用户重视。许多商家发现好评能带来巨额回报,差评能让对手亏损甚至倒闭,所以“刷评”行为一直存在。为了防止卖家的恶性竞争、保证电商平台能够公平交易、保护消费者的权益不受侵犯,检测虚假评论一直是个研究热点。本文对虚假评论检测进行深入研究,主要工作分为以下几个方面:首先,针对Word2vec模型无法识别英语中的词对信息进
论文部分内容阅读
由于网购接触不到商品,所以用户只能从电商平台上了解相关的产品信息,其中评论信息越来越被用户重视。许多商家发现好评能带来巨额回报,差评能让对手亏损甚至倒闭,所以“刷评”行为一直存在。为了防止卖家的恶性竞争、保证电商平台能够公平交易、保护消费者的权益不受侵犯,检测虚假评论一直是个研究热点。本文对虚假评论检测进行深入研究,主要工作分为以下几个方面:首先,针对Word2vec模型无法识别英语中的词对信息进行改进,提出了Bigram-Word2vec模型。该模型首先利用Bigram模型识别英语中的词对信息,在此基础上,对文本信息进行处理以后,再输入到Word2vec模型中训练相关的词向量。其次,由于词对取值个数的不同,Bigram-Word2vec模型训练出来的词向量的质量也不同。为了进一步优化Bigram-Word2vec模型,本文尝试了取多组值用于训练词向量,以寻找最优的词向量。再次,为了解决传统的虚假评论检测领域中使用单一的机器学习模型的问题,本文将异质集成学习领域中的相关知识应用到虚假评论检测领域中。在尝试将多个异质模型进行集成的过程中,针对异质集成学习中硬投票法遇到投票数相同及软投票法中权重如何设置的问题,提出了两种解决方式:二分类加权硬投票法和加权软投票法。最后,本文使用多种文本特征提取方法对亚马逊数据集进行特征提取,再结合多个模型对文本进行分类。为了对分类结果不理想的原因做出解释提出了“词重复率”的概念。同时也在该数据集上验证了本文提出的方法。
其他文献
近年来,卷积神经网络在机器学习与计算机视觉领域取得了巨大成功,如图像分类、语义分割、目标跟踪、对象检测等领域。由于巨大的存储占用以及计算开销,使得卷积神经网络在移
推荐系统通过分析用户偏好数据来产生推荐信息的特性,使得一些攻击用户或者团体为了自身经济利益,对目标商品进行虚假评分,干扰推荐系统的推荐结果。为了消除攻击用户对推荐系统的影响,国内外学者对攻击用户的行为进行分析,提出了一些识别攻击用户的方法。但是为了快速有效的达到攻击的目的,攻击用户通过联合形成群组攻击,群组攻击具有较强的隐蔽性且对推荐系统的威胁更大。现有的一些检测攻击用户的方法并不能很好的对群组攻
《通鑑》胡注一書内容豐富,徵引廣博,可與《史記》《漢書》舊注形成對比,以資校勘、考證之用,具有重要的史料價值。胡注成書年代所見《史記》《漢書》版本較今之傳本可能更爲
共识机制是区块链系统的核心,目前主流的共识机制主要包括PoW(Proof of Work,工作量证明)、PoS(Proof of Stake,权益证明)、DPoS(Delegated Proof of Stake,委托权益证明)等,但是这些共识机制具有其自身的限制,例如:PoW类共识机制需要消耗大量能源;PoS类共识机制中大部分代币在少数人手中,中心化严重;DPoS类共识机制中矿工的选取依赖于股权
黑磷是一种新兴的二维纳米材料,自2014年被成功剥离以来,因其独特的性质而受到广泛关注。和石墨烯类似,本体黑磷是一种层状材料,由单个原子层通过范德华相互作用堆叠而成。黑
超分辨率图像重建是一项从包含信息较少的低分辨率图像中恢复出包含信息较多的高分辨率图像的技术,目前已经成功应用在医学造影、图像分割、目标检测等领域.论文基于深度学习
模型预测控制(Model Predictive Control,MPC)因其具备对模型要求低、鲁棒性好、可以较方便地处理约束等能力,近几十年来在工业领域得到广泛应用。MPC采用滚动优化方式,在每个控制周期内都需求解一个约束优化问题。为了在实际应用中取得较好的控制效果,通常需要采用较短的采样间隔和较长的控制时域,在线计算量的剧增和采样间隔的减小大大限制了MPC算法在快速系统中的应用。因此,提升MPC
农田水利工程是农业生产和发展的命脉,而小型农田水利设施(以下简称“小农水”)因其地域分布而与农业生产关系更为密切,小农水还关系到粮食安全、农民创收以及农村经济发展。
入侵检测系统可在无网络管理员运作的条件下,积极主动的为计算机网络提供外部攻击、内部攻击及误操作的实时保护,现已成为一种重要的网络安全工具。粗糙集中的属性约简方法通
事件触发控制最早应用于资源有限的系统,通过设计与状态相关的触发条件并按照触发条件的满足与否进行信号传输与系统控制,从而使得系统资源可以得到有效利用,解决资源有限系统中计算资源(优化次数)与系统稳定性间的矛盾。在约束预测控制中,除了系统资源与稳定性的矛盾,还存在系统可行性、最优性与计算复杂度的基本矛盾,但这一矛盾可以通过根据系统状态合理地设计终端约束来解决。本文不仅通过设计与终端约束相关的事件触发条