基于结构注意力增强的虚假评论识别算法研究

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:cpts
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着点评和购物平台的不断发展,消费者在购物后可以发表和共享真实的消费体验,也成为了后序消费者购买该产品或服务的关键性参考因素之一。为了扩大自身市场占有率,一些不良商家,通过伪造评论内容形成了大量虚假评论。一方面误导了消费者的决策,影响了其切身利益和增加了退换货风险;另一方面,营造了商业平台的恶性竞争环境,不利于其长远发展。为了对虚假评论进行有效建模识别,本文利用评论文本构建出HSEAN(Hierarchical Structure Attention Enpower Network)识别模型。不仅提取出了丰富的语义特征,而且诱导生成了文本的结构依赖树和提取了树结构的遍历特征,现对本文的研究内容进行归纳如下:(1)提出了嵌入结构注意力增强机制的网络模型HSEAN。以‘词-句-段’的层次化网络为基础,分层嵌入结构注意力增强机制,用于文本单元的依赖学习和后序的结构依赖树生成。不仅能够对GRU做非前后文自由语序单元语义补充,更是对文本单元前后文一致性的检测。以此来判别评论者在撰写评论时,是否是通过浏览真实评论而恶意剪辑的文本。实验结果表明,对比于其他基于特征挖掘的传统机器学习分类算法和基于词嵌入的常用神经网络模型,本文提出的模型取得了最优的实验性能。(2)构建了端到端训练的结构依赖树诱导生成算法。针对评论文本无第三方文本分析工具和额外的领域标注数据集的现实条件下,通过模型学习到的文本依赖关系矩阵和根概率向量,利用集束搜索和贪婪搜索相组合的方式,尝试直接从训练数据中诱导生成文本的结构依赖树。(3)设计了基于结构依赖树的四类遍历特征。定义了一组描述树结构的遍历属性。提取并分析了虚假评论文本和真实文本之间的显著差异性。进一步表明了虚假评论在上下文的一致性较差,为面对不同平台上的数据集,只针对评论文本建模,指明了新的特征提取方向和手段。
其他文献
<正> 我科收治肾炎水肿患者十二例,根据“辨证论治”法则进行治疗,收到显著效果。兹将治疗经过介绍于下。治疗法则与配伍药物我们以防已黄耆汤为主剂(防已、黄耆、白术、甘草、生姜、大枣),再结合患者的病况发展,适当地灵活辨证处方,主要以“开鬼门”、“洁净府”、“实脾土”、“温肾阳”为法则;
期刊
全球化进程中,国际移民的规模和范围日益扩大,语言实践的形态和内涵也因此变得更加多元。跨国移民往往身处多语环境,可使用更多的语言资源。随着网络技术的发展和新媒体的出现,社交媒体成为新的网络话语空间和交际空间,移民群体在社交媒体中通过多语实践来进行自我表达和自我呈现,建构虚拟身份,同时也展示其语言意识形态与价值观。本研究聚焦意大利华裔青年在Instagram这一社交媒体上的多语实践,探究其外在表现、原
学位
随着全球化进程的不断加快,跨文化交际显得越来越重要。2018年1月,教育部新颁布的《普通高中英语课程标准(2017版)》(以下简称《新课标》)中提出要发展学生的四大核心素养,其中文化意识素养要求学生坚定文化自信,具备一定的跨文化沟通和传播中华文化的能力。而教材作为学生学习和教师教学的载体,其所包含的中国文化内容对于培养学生的文化意识具有关键作用。《高中英语》(上外版)教材是根据《新课标》进行修订的
学位
在课堂教学改革的背景下,课堂更加注重以学生为中心,强调学思结合。课堂互动作为课堂教学的关键,近年来对课堂互动的研究主要关注课堂互动话语、课堂互动质量评估、课堂互动影响因素三大议题。已有研究大多关注教师如何解读课堂互动,而对学生的具体反馈关注较少。基于对课堂互动影响因素问题的回应,本研究以上海某大学本科课堂为例,提出以下三个研究问题:(1)以对话式教学为主的课堂互动情况如何?(2)教室(课堂)空间对
学位
研究了ZnSe:Mn的光导激发谱。室温下观察列两个峰:4600(?)和5380(?)。还研究了4400(?)及5200(?)激发下光导与温度的关系。根据这些实验认为:Mn2+离子的第一激发态~4T1,非常接近导带。理论上导出了5200(?)激发下光导对温度的依赖。调节参数将理论与实验进行拟合。从选定参数中得出:Mn2+的~4T1态位于导带下0.054eV。4400(?)激发下光导与况度的关系用陷阱
期刊
玉龙雪山是我国季风海洋型冰川发育最为典型的代表性地区,也是北半球最靠近赤道的现代冰川区。丽江市的部分水源来自于玉龙雪山冰川融水,同时玉龙雪山景区每年吸引着上千万的游客来欣赏现代冰川。旅游活动与水环境息息相关且相互作用,水环境的准确刻画是指导与优化区域旅游活动的基础。以世界著名旅游城市丽江市为例,基于实地采样与数据分析,对2018年丽江市的旅游活动与水环境进行耦合分析。结果表明:丽江市旅游活动与水体
期刊
多智能体系统因其广阔的应用领域,引起了众多学者的关注。一致性问题是多智能体系统研究的理论基础,也是研究的重点。目前,学者们对于线性多智能体系统的一致性已经有了相当丰富的理论结果。但关于更为普遍的二阶非线性多智能体系统群跟踪控制和群一致性的理论结果却相对匮乏。本文以图论,矩阵理论和李雅普诺夫稳定性理论作为研究工具,对非线性多智能体系统的群跟踪控制和群一致性进行研究。本文的主要内容包括:1.在无通信时
学位
我国碳市场已进入第二履约周期运行,碳市场为火电企业增加碳排放成本项,以市场手段推进电力行业碳减排。文章构建了以火电系统成本优化为目标的电力系统模型,可以模拟碳市场的经济影响,是分析碳市场对系统运行影响的有效工具。采用自下而上编制的全国厂级火电碳清单,考虑全国各省尽量满足风光水核可发电量消纳的源网荷运行平衡,构建计及碳市场成本的全国电力系统模拟模型。模型可模拟得到当前碳配额规则下火电厂碳市场成本的区
期刊
目前,整合技术的学科教学知识理论框架己被广泛应用于现代教育研究之中。基于技术整合的研究现状,本研究旨在探索初中英语专家教师与新手教师在整合技术的学科教学知识水平的异同和影响因素。首先,探索初中更英语专家型教师与新手教师在课堂上TPACK水平异同;然后分析影响两者TPACK产生差异的因素。本研究采用课堂观察和访谈的方式,基于研究目的和研究便利性原则,笔者在所实习的上海市S学校选择了具有典型代表性的一
学位
侯清仁是我国第一个核武器研制基地221厂的一名高级工程师。221厂撤销后,侯清仁随即退休回到了老家。在湖南省保密部门的帮助下,本刊记者几番辗转采访了侯清仁,听老人讲述当年的保密往事。不久前,老人突然离世,我们深感震惊与悲恸,谨以此文表达对老人的哀思,同时也向所有为我国核事业默默奉献的无名功勋们致敬!
期刊