基于情感词典和深度学习的中文书评情感分析

来源 :兰州大学 | 被引量 : 0次 | 上传用户:leader_007cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断发展,数字化信息给人们带来很大的价值,不仅可以帮助商家发现商品的不足,还能帮助消费者选择心仪的商品.当数据量不断增长时,传统的情感分析方法已无法满足海量数据的处理,且效果过于依赖人工特征.本文以情感分析的主流研究方法和BERT预训练模型为背景,结合情感词典和深度学习对中文文本进行情感分析.首先结合BERT词向量和情感词典作为句子的特征矩阵;其次利用一维卷积层提取文本信息的特征,压缩词向量的维度,再使用CNN和双向门控递归单元(Bi GRU)网络获取评论中的主要情感特征和上下文特征;最后通过注意机制进行加权,对加权后的情感特征进行分类,并与其它的模型结果进行对比实验.根据实验结果得出,本文提出的词向量拼接情感词典的效果比运用情感词典对词向量进行加权的效果好,并且在CNN前增加一维卷积层能够对学习词向量特征起到很好的作用,最终得到的模型的准确率和F1分数分别为94.67%、94.65%,比SLCABG模型效果提升了超过1%.
其他文献
(5,6,7)-富勒烯图是指3-正则平面图且仅含有五边形面、六边形面以及七边形面,它也是通常富勒烯图的推广.对一个(5,6,7)-富勒烯图,一个六长面圈称为共振的若它的边界(或它本身)是一个-交错圈,其中是图的完美匹配.(5,6,7)-富勒烯图的环链是指由9)个面圈的圆形排列形成的子图,使仅有两个相继面圈含有公共的边且这些公共边都是独立的,记作[(a1,(a2,...,(ai)],其中(ai)∈{
学位
大数据、云技术、人工智能等科学技术日异月殊,推动社会经济、物质生活以及人类思想意识不断进步,与此同时也产生了信息泄露、网络诈骗、病毒传播等复杂问题。金融作为国家重要的核心竞争力之一,防范和化解金融风险是金融工作的根本性任务。近年来我国金融产品和服务日新月异、琳琅满目,但也存在金融欺诈、理财乱象、金融消费者投诉量增多等风险和问题。国内多位专家学者也提出借鉴美国消费者金融保护局的经验建立系统化、科学化
学位
锅炉水冷壁容易出现腐蚀、爆管等缺陷,这严重影响着火电机组的安全运行。电厂锅炉存在内部空间较大、温度较高、检测孔口较小等问题,人工检修效率较低且易出事故。四旋翼无人机是近年来发展较快的一种飞行器,因其具有垂直起降、定点悬停、操作简单等众多优点而被用于工业巡检。本文设计了一款面向锅炉进行巡检作业的高负载折叠式耐高温四旋翼无人机用于锅炉缺陷自动化检测,并基于ANSYS仿真软件验证了无人机结构强度和高温环
学位
文本数据具有非结构化特点,很难被计算机识别,因此需要对文本数据进行向量化表示.其中能否合理有效的表示文档信息是影响文本分类性能的显著因素,因此需要选取合适的文本表示方法.本文具体工作如下:本文通过融合潜在狄利克雷分配模型(LDA)和Word2Vec词向量模型即建立LDA_Vec模型来对文本数据进行表示,经实验表明该表示方法优于LDA+Word2Vec模型表示方法的分类效果.在模型建立的过程中,由于
学位
天气对人类的交通、农业、工业等方方面面都有重要的影响,天气图像识别在人工智能、公路交通状况预警、汽车辅助驾驶、气候分析等领域具有广阔的发展前景.由于采集方法和采集设备不同,天气图像大小不一,常规预处理方法会导致信息损失;同时,天气图像容易受到复杂的、非系统的因素干扰,因此天气图像识别存在分类精度不高的问题.此外,天气图像数据集通常数量庞大,如何进一步提升天气图像识别速度是亟待解决的问题.对此,本文
学位
柔性铰链(柔铰)是在外部载荷作用下利用其自身材料的弹性形变实现相邻杆件运动传递的一类特殊运动副,具有高精度传动、无间隙、无摩擦磨损及免润滑等优点。现有理论模型主要面向单、双轴拉伸缺口型柔铰展开,现有同轴回转缺口型柔铰的结构类型较少、理论模型准确性及通用性不足。但随着增材制造等新型加工方法的发展及空间多自由度柔性精微定位需求的增加,对同轴回转缺口型柔铰相关结构概念表征、理论柔度精度及应力水平进行深入
学位
胸片诊断作为诊断新冠肺炎的手段之一,能够分担一部分分子测试所带来的压力.而机器学习算法尤其是深度学习算法在医疗图像诊断领域彰显了其强大的学习与预测能力,利用目标检测算法可以帮助放射科医生更快地定位新冠肺炎患者的病变位置,来辅助诊断、量化和预测新冠患者的发病程度,以便更好地调度医疗设备等资源,从而有效抑制新冠疫情的爆发.本文旨在帮助放射科医生更准确快速地诊断新冠病毒患者,使医生能够判断新冠患者疾病的
学位
在数字时代,随着信息存储与获取的便捷性,大量的个人数据被企业存储,企业和消费者间的数据互动已成为普遍现象。同时,通过窃取企业或消费者数据以获利的不法行为已呈现不断加剧的趋势。因此,企业和消费者不得不面临便捷与安全的困难抉择。通过采取有效措施保护自身的数据安全,减少或防止数据泄露已成为两者共同的强烈需求。最近的研究表明,数据泄露量具有偏态性,稀疏性与变异性等特点,这对行业数据泄露量的建模与预测产生了
学位
科技的快速发展,使得“互联网+”被越来越广泛地运用于各个领域,比如数字音乐。推荐系统不仅能够帮助用户快速定位目标,而且有利于公司实现利益最大化。因此,推荐引擎饱受青睐,其核心部分就是所谓的推荐算法。传统的推荐算法虽在一定程度上能够解决信息过载问题,但对于解决数据稀疏性、个性化能力不足等问题效率低。针对以上问题,本文提出一个效率更高的算法:引入隐式反馈特征的Stacking融合模型。该算法首先以用户
学位
多相流问题是计算流体力学领域学者们竞相研究的热门问题之一,其中,气-液多相流是一个重要的研究方向。各种流体之间会发生很多复杂的现象,其中质量、动量和能量的交换经常发生在气-液两相的界面处,尤其是在解决大密度比、大黏度比而导致的两相界面处大压力梯度的问题,是处理气-液多相流问题时存在的主要难点。首先,根据上述难点,本文针对不可压缩、非混溶的复杂多相流问题,提出了一种广义守恒相场简化多相流格子Bolt
学位