基于主题情感模型的虚假评论检测方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:woyaodeaihaiyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代,在线评论逐渐成为人们交流、分享的主要方式,同时也是了解信息的主要渠道之一。互联网的高效性和便捷性,极大地加速了在线评论的传播速度,但在为人们提供便利的同时,也会导致虚假评论信息在互联网上肆意传播,损害用户和商家的利益,破坏市场规则,甚至影响社会秩序。在线评论在互联网上通常以文本的形式存在,不仅包含文本的结构信息,也包含着对事物特征的描述和情感表达,即文本的主题信息和情感信息。现有的许多虚假评论检测方法,通常是综合利用文本的词频、用户行为特征、情感、结构等多种信息,在提取到文本的特征向量后,通过结合分类器来识别虚假评论。本文在LDA主题模型的基础上开展对虚假评论检测方法的研究,通过综合借鉴现有多种相关主题模型的先进思路,探索改进的文本特征提取模型,并将其与多分类器相结合提出新的虚假评论检测方法,实现对真假评论更好的分类效果。本文研究贡献主要包括以下三个方面:(1)在深入分析当前多种基于LDA的改进模型特点基础上,提出了一种能够同时融合文本主题、情感和结构信息的句子级主题情感模型SJTSM,用于文本特征提取。进而,基于该模型和一种由支持向量机、决策树和朴素贝叶斯分类器组合而成的特殊多分类器,提出了一种基于句子级主题情感模型的虚假评论检测方法,实现对虚假评论更有效的检测。(2)针对实际应用中的主题可能是一个词或多个词(如名词短语),而许多现有主题情感模型提取的主题结果因采用单个词表示主题而可能存在表达歧义的问题,提出一种能够在一定程度上解决主题表达歧义的语块级主题情感模型CTSM。进而,通过将该模型和一种现有的单词级主题情感模型以及上述句子级主题情感模型相结合,提出一种融合多级别主题情感模型的虚假评论检测方法,进一步提升对虚假评论的识别能力。(3)为验证上述提出方法的科学有效性,在多个公开数据集上与现有相关方法进行了对比实验。结果表明,本文提出的两种方法在虚假评论检测实验中都取得了更好的分类效果。
其他文献
随着互联网的兴起,人们每天都要面临数以万计的信息,推荐系统在帮助用户过滤冗余信息方面起着举足轻重的作用。互联网的兴起也使得在线社交网络和在线社区快速发展,兴趣相近的用户形成了各种各样的社区或群体,在线群体活动越发普遍。面对生活中丰富多彩的信息,传统的个性化推荐系统已经不能满足用户的需求,面向群组的推荐系统收到了广泛的关注。区别于传统的个性化推荐系统中向单一用户进行推荐,群组推荐系统的目标对象变为一
智能网联汽车是近年来兴起的一种跨技术、跨产业领域的一种新型汽车体系,具备有相应的信息感知能力,是车联网体系的一个重要支点,最终实现路面信息、车载终端以及业务平台的无线通信和信息共享。对于智能网联汽车来讲,信息采集系统和通信系统的设计将成为支撑整个车联网体系的重中之重。随着人们对于车辆舒适性能和安全性能的要求越来越高,车辆内部的线束和电子设备越来越多,各个模块之间数据交互和协调机制变得越来越复杂。而
抽水蓄能电站在保障电力系统安全、灵活调峰调频、促进新能源消纳等多方面发挥着重要作用,发展需求持续增长。抽水蓄能电站在运行时会产生较大的散热量,若地下厂房利用竖井排风,则易产生较大的自然通风动力,具有巨大的节能潜力。抽水蓄能电站具有多种工况周期性转换的特点,并且进风洞在湿热季节易产生空气冷凝,这些因素使得其地下厂房自然通风的变化规律变得复杂,值得进一步研究。为此,本文通过理论分析、现场调研及数值模拟
杰克·伦敦在《马丁·伊登》中塑造了一个追求“理想自我”的个人奋斗者——马丁·伊登。在这一过程中,他实现了身份的转变,即由水手到作家的转变,却因其认同的不一致而处于孤独状态之中,呈现出孤独者的形象。这一孤独者形象背后反映出的是作者杰克·伦敦对于“美国梦”的态度转变,即由认可到怀疑再到反思的转变。与此同时,这一孤独者形象也折射出杰克·伦敦本人的部分状态。因此,本文拟将在文本细读的基础上运用认同理论,从
在水环境污染和能源危机的背景下,微藻由于具备生长速度快,光合效率高,经济效益高,环境友好,适应性强等优点,成为了污水处理以及资源化的研究热点之一,具备广泛的应用前景。在微藻的研究中,紊流和外源植物激素是影响其生长和生物质成分的两大重要影响因素。目前的研究大都着眼于植物激素浓度对于微藻处理污水效果和生长特性的影响,而紊流的存在可能对植物激素的作用效果产生影响。关于紊流和植物激素对微藻生长的影响及其机
铁水物流是钢铁企业中通过工艺铁路运输铁水的一种特殊物流方式,物流中的铁水运输直接关系到相关生产人员的人身安全以及企业钢铁生产的效率,同时铁水物流也是涉及多部门协作的复杂工作。原有的铁水物流管理系统不能满足现在钢铁企业向生产规模化和管理智能化发展的需要。所以铁水物流的信息化和智能化建设对钢铁企业生产的提质增效具有重要意义。本文以国内某钢铁厂的智慧铁水物流项目作为背景,分析了原有系统所存在的问题。针对
随着大数据时代的到来,电商平台相继进入数据价值驱动的运营模式。对于农产品电商平台而言,供应商质量关乎平台的竞争力甚至是平台生命线,因此,借助数据对供应商进行评估甄选是目前许多企业的迫切需求。但中小型农产品电商平台囿于自身数据不足以及成本过高等原因而无法独立搭建维护数据分析系统,一直无法享受这波数据红利。基于此,鉴于数据仓库优秀的数据整合以及分析能力,本论文致力于以现有理论模型为基础,将其针对性实现
玛格丽特·德拉布尔以其女性题材系列小说在20世纪的英国文坛中散发着强劲的光芒,她始终遵循现实主义传统,致力于刻画知识女性的诸种现实问题与生存困惑,著述颇丰,影响斐然。20世纪以来,神话思潮席卷西方,以诺斯洛普·弗莱为代表的神话-原型批评理论也应运而生,神话-原型理论重在探究文学中某种反复出现、被叙写的范式,通过解读原型潜隐于小说叙事下的深层内涵,深析作家对原型进行置换变形下的突破写作,探究作家个体
在竞争日益激烈的买方市场中,为充分满足客户的多样化、个性化需求,传统模式下面向库存的大批量制造模式已经逐渐被面向订单制造模式所替代。物料配送作为制造企业车间生产物流的重要组成部分,及时准确的配送是保证车间生产正常运行的有力支撑。然而,由于面向订单制造企业产品制造过程复杂、需求物料种类较多,车间物料配送中存在工人频繁取料、配送工具不合理、工位时常缺料、配送不及时等问题,严重时甚至影响产品的按时交付。
齿轮传动系统作为活塞发动机传动系统的重要组成部分,其传动特性极大地影响了整个系统性能,然而由于航空活塞发动机飞行条件多变以及工作环境恶劣,导致齿轮传动系统的载荷工况复杂,其强度和寿命受到极大考验,对齿轮的可靠性提出了较高要求。本文以某活塞发动机齿轮传动系统为研究对象,在系统传动原理与结构分析的基础上,完成了齿轮系统宏观参数优化设计;研究了不同载荷工况下齿轮副啮合特性,完成了轮齿微观修形;建立了考虑