【摘 要】
:
随着Web2.0技术不断发展,互联网进入了大数据时代,数据价值越来越突显其重要性,传统数据挖掘主要关注于结构化数据,近年来,非结构化数据的研究和应用逐渐受到重视。文本数据作为互联网中最基本数据类型,蕴含了巨量的价值信息,而情感分析是自然语言处理的重要分支,其在舆情监控、市场营销、欺诈识别、经济预测等诸多领域均有着广泛的应用。基于此,如何透过文本数据给出更多有用的情感分析是需要我们深入探讨的问题,有
论文部分内容阅读
随着Web2.0技术不断发展,互联网进入了大数据时代,数据价值越来越突显其重要性,传统数据挖掘主要关注于结构化数据,近年来,非结构化数据的研究和应用逐渐受到重视。文本数据作为互联网中最基本数据类型,蕴含了巨量的价值信息,而情感分析是自然语言处理的重要分支,其在舆情监控、市场营销、欺诈识别、经济预测等诸多领域均有着广泛的应用。基于此,如何透过文本数据给出更多有用的情感分析是需要我们深入探讨的问题,有其重要的理论及应用价值。目前用以文本数据情感分析的常用技术有机器学习算法和深度学习算法等,相较于传统的机器学习算法,深度学习算法减少了人工提取特征的麻烦且效果大幅提升,在人工智能领域有广泛应用。本文在深度学习Bi-GRU模型的基础上,尝试与多头注意力机制模型相结合,构建了Bi-GRU与多头注意力机制结合模型,从正反双向、多层次角度,开展了文本数据的情感分类研究,主要研究内容包括:1.构建了Bi-GRU方法与多头注意力机制结合模型,包括:(1)构建了模型的算法流程;(2)给出了模型各层算法方案,解释了各层算法功能与内部构成,以及各部分连接等。2.选取69213条电商平台文本数据为代表数据,进行了文本数据模型实验,实验内容包括:(1)针对粤语方言或繁体字,对原始数据进行了有效的预处理;(2)完成了BiGRU模型、多头注意力机制模型及二者结合模型的相关程序运算;(3)设定模型相关参数,给出了模型的评价标准。3.在数据模型实验的基础上,进一步对二分类电商数据进行了系统调参,完成了准确率检验,并以准确率、交叉熵为评价标准,与几种主流循环神经网络模型及变体模型(包括Bi-LSTM模型、Bi-GRU模型、Bi-LSTM+多头注意力模型、Bi-GRU+多头注意力模型等)进行了对比。研究结果表明,本文所构建的Bi-GRU与多头注意力机制结合模型是合理有效的,具体表现在:(1)它可以捕捉到长序列的语义信息,有效抑制梯度消失或爆炸现象;正反双向捕获语义信息覆盖更为全面;以多层次角度给予更精细的情感分析与刻画。(2)电商平台数据实验验证了构建模型对具体文本数据实施的可行性。(3)并与4种系列模型对比效果显示了本文构建模型效果优于其他4种模型。
其他文献
2018年4月,双层股权结构在港交所正式放开,以小米公司为首的众多在国外上市的中国双层股权结构企业纷纷选择回归国内资本市场,以双层股权结构的形式在港交所上市。2019年3月,双层股权结构正式在科创板放开,这也是我国A股市场对双层股权结构的首次实践。随后,优刻得公司率先以双层股权结构的形式在科创板成功上市,这对我国资本市场全面放开双层股权结构的推进意义十分重大,也意味着双层股权结构即将在我国实现迅猛
近年来,高技术产业成为了一国科技发展的主力军。随着高技术产业在各国的国际竞争中起着越来越关键的作用,其创新能力的高低往往彰显着该国经济在未来一段时间内的可持续发展能力。随着FDI不断涌入我国,高技术产业也成为了对外商投资吸引力较强的重点投资领域之一。创新作为我国近年来发展战略的重中之重,特别是高技术产业创新的能力与水平,成为了推动我国未来发展的核心竞争力之一。根据以往的研究来看,FDI对高技术产业
温和且适度的泡沫可以刺激经济,但泡沫不断膨胀至破裂会对经济产生负面影响。美股在全球资本市场处于主导地位,仅有近30年发展的中国股市同样取得了享誉中外的成绩。因此,分析中美股市泡沫的存在性并寻找破解股市泡沫的方法,对遏制过度投机、维持我国股市和经济的健康发展、防止金融危机具有重要意义。鉴于此,本文分别择取2003-2020年中美股市代表性指数,借助Phillips P C B and Shi S(2
近年来,服务企业之间的竞争越来越激烈,能为企业带来竞争力的不只是产品或服务了,还包括那些扮演企业兼职员工角色的顾客,这些顾客自发地做着对企业有益的行为,如推荐产品或服务给他人、积极反馈建议、帮助其他顾客更好的完成服务等,这些行为为企业带来的价值日益得到重视,因此,在引导顾客公民行为上,企业可以依赖哪些方法也被学者们重视。而在服务行业,通过创建更好的服务场景来引导顾客行为、吸引顾客被认为是重要且可行
区域一体化体现为一种有影响力的增长战略,该战略为新兴产业的发展提供了相似的广阔市场,并通过增加国民收入和议价能力消除了外部冲击.在非洲,全球和区域两级更加多样化的农业贸易可以为提高价值链上各阶段的生产力提供杠杆,并促进农业转变为高生产力部门,为生产者提供足够的收入,刺激整个经济的增长。增加农业贸易也有可能改善粮食安全,并有助于稳定地方和区域粮食市场,减小市场受冲击的威胁。非洲国家正在寻求增加国内生
随着大数据和人工智能技术的发展,我国智慧法院的建设如火如荼。在司法智能化领域,大数据技术可以服务于案件审判、判决执行和司法管理。本文以北京市法院2020年公开的民间借贷纠纷案一审判决书为例,结合要素抽取、描述统计、相似度计算和文本分类等文本挖掘技术,探索出一套可推广的民事案件研究方法,达到识别类似案件和预测胜诉率的目的。该成果可在庭审前预判案件的胜诉概率,辅助当事人及时调整诉讼方案。这既能降低当事
随着经济高速发展和人民物质水平的提高,旅游业蓬勃发展必将带来住宿行业用户的不断增长,而住宿行业线上渗透率远低于机票、火车票等旅行服务,说明在线住宿行业仍有较大的发展空间。目前在线酒店预订行业形成了携程、美团、飞猪三足鼎立的局面,三方在商业上的打法各有不同,但都在为争夺在线酒店预订市场做出各自的努力。而在线酒店预订的核心场景是房型推荐,该场景能否精准且快速地满足用户对房型的需求对于在线预订服务网站的
现阶段我国经济发展水平虽与日俱增,但经济发展不平衡的弊端也渐渐显露出来。消费内需不足,经济发展更多的倾向于依靠投资和贸易带动,限制了经济的平衡和持续性发展。居民的储蓄在很大程度上是预防未来可能发生的不确定危机,主要是养老方面的支出并不确定,所以居民在现期消费的信心就会大幅减弱。养老问题是每个居民都将会面临的社会性问题,我国又处在老龄化日趋严峻的阶段,人口预期寿命也在增长,如何在保障人们基本生活水平
<正>1 研究目的(Objective)锂金属是21 世纪最有应用潜力的金属,广泛应用于高能电池、储能、航空航天、受控核反应等多个新兴行业和领域。因其重要的工业和经济价值,美国、日本和欧盟相继将锂列入国家战略性或关键性矿产,并在全世界储备相关资源。在此背景下,我国也出台了对应政策,并加大了国内锂矿资源的勘查和开发。
目前我国人口老龄化程度持续加深,老年人口对于社会保障及养老体系带来巨大压力和挑战。家庭结构小型化导致家庭养老模式在面对老年人日益增长的多样化养老需求时供给不足,同时机构养老模式由于各种主观因素和客观因素导致不被老年人普遍接受。为了缓解我国养老的巨大压力,国家出台了相关政策法规来促进我国养老事业的发展,社区居家养老模式应运而生。社区居家养老模式可以通过家庭和社区的共同支持有效缓解养老压力,但目前我国