基于BILSTM-Attention的书评情感分类研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:chunling329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的繁荣发展,电子商务逐渐进入人们的生活。线上购物时,在线评论是消费者了解商品质量的重要渠道。在出版领域,豆瓣书籍评论也成为消费者购书的重要参考。面对海量用户评论,情感分析技术能够将用户评论按照情感倾向分类,有效挖掘评论信息,帮助消费者了解书籍风评。目前,关于中文书评情感分析的研究文献大多采用情感词典和支持向量机等传统机器学习方法。由于书评文本往往包含大量抽象的情节描述,因此在情感分析任务中,对模型深层语义的提取能力要求较高。同时注意到,深度学习模型已在微博等社交媒体短文本情感分析领域取得优秀成果。因此,本文在BILSTM-Attention模型的基础上,将知识增强语义表示(ERNIE)模型、多头注意力机制与文本句法特征融合,提出了 BMAE(BILSTM Multi-heads Attention ERNIE)深度学习情感分析模型;基于TensorFlow和百度飞桨深度学习框架,以豆瓣书评为依据,探究深度学习在书评情感分析任务中的应用效果。本文的主要工作有:(1)基于Uipath软件搭建流程机器人,批量收集豆瓣读书短评,建立了书评短文本语料库。为提升文本向量化效率,本文对比了 ERNIE、BERT、Word2vec三种方法,最终选择了准确率更高的ERNIE模型。(2)在BILSTM-Attention模型的基础上,提出BMAE模型。为解决并行多头注意力机制无法收敛的问题,本文尝试叠加多头注意力机制、前馈神经网络与自注意力机制,降低模型复杂度的同时,加入正则惩罚项缓解了过拟合问题。此外,本文对评论文本进行词性标注,在模型中引入词语位置信息和文本句法特征。模型参数选择方面,本文尝试基于一个正交设计进行优化。相比基础BILSTM-Attention模型,BMAE在准确率、精确率、召回率、F1值四个指标上分别提升了 3.17%、2.07%、3.82%、2.94%。(3)具体分析包含情节描述的书评文本,验证了 BMAE模型在处理此类书评时,准确率远高于情感词典方法。此外,本文还分析了 BMAE模型的错分样本,为模型的后续改善提供了方向。
其他文献
本文应用Poincaré-Birkhoff扭转定理和SAP映射方法研究超线性不定位势的二阶微分方程x"+q(t)g(x)=p(t)的周期和混沌动力行为.包括如下两个问题:一、超线性不定Hill方程的周期解以及Dirichlet边值问题解:二、超线性不定位势强迫振子的周期解和混沌动力行为.第一个问题:研究超线性不定位势的Hill方程x"+q(t)g(x)=0.以往的研究需要q是有界变差函数,并且积分
学位
目的:肺炎克雷伯菌(KP)是医院内感染的重要病原体。KP可引起严重的全身多系统的感染,其中KP血流感染(KP-BSI)有更高的抗菌药物耐药率及更高的死亡率。重症监护病房(ICU)患者由于病情严重、免疫力低下而面临更高的KP感染风险。以苏州大学附属第一医院多个ICU的血培养提示为KP-BSI的住院患者为研究对象,以血培养阴性且下呼吸道分泌物标本培养仅检出病原体为耐碳青霉烯类肺炎克雷伯菌下呼吸道感染(
学位
储备池计算是一种适用于处理时间序列的简单高效的机器学习算法。其主要思想是用一个储备池代替传统神经网络的隐藏层,只训练部分连接权值,其余权值随机生成且固定不变。极大简化了训练过程,在时间序列预测以及非线性系统识别等领域有着成功的应用。本文在储备池的基础上引入了时滞项,提出一种新型的时滞储备池,通过对内部节点添加时滞项来减少储备池中神经元节点的个数。将储备池视作一个高维的非线性动力系统,结合非线性动力
学位
目的:探讨基于磁共振多参数影像组学模型术前预测乳腺癌前哨淋巴结转移的价值。方法:回顾性分析2015年1月至2021年10月在苏州大学附属第一医院经手术病理证实为乳腺癌的210例女性病人的临床、病理及MRI资料。对病人T2WI、DWI及DCE-MRI第2期相进行影像组学靶区勾画,并按照7:3的比例随机分为训练集(147例)和验证集(63例),提取影像组学特征,应用最大最小值归一化算法将所有原始特征向
学位
<正>名医验方【方名】养血调经汤【组方】鸡血藤20 g,丹参15 g,当归10 g,川芎6 g,白芍10 g,熟地黄15 g,川续断10 g,益母草10 g,炙甘草6 g。【功效】补肝肾,养血调经。【主治】肝肾不足、血虚所致的月经病症。【方解】本方由《医学心悟》之益母胜金丹化裁而来。益母胜金丹为肝、脾、肾并治之方,但偏于补益肝脾。基于肾藏精,精源于肾,肝藏血,精血互化,肝肾同源的理论,并受唐宗海“
期刊
本文考虑了二维磁性六边形晶格材料CrCl3中离散自旋的连续极限。通过定义六边形晶格上的差分格式及相应的插值算子,我们首先证明了 Landau-Lifshitz-Gilbert方程解的极限的存在性;其次证明发现该极限是某个连续偏微分方程的弱解;最后研究了连续模型解的性质,包括局部光滑解、强-弱唯一性以及小初值下的全局光滑解。这些结果一方面给出了连续模型中参数对材料参数的定向依赖关系,又为微磁学仿真提
学位
给定有限群类V,可以对一个自由群赋予pro-V拓扑,于是就产生了子群在自由群中关于该拓扑的闭性或者求闭包的问题。已经知道的结果是:V取全体有限群时,有限生成自由群的有限生成子群均是闭的;V取全体有限p-群或者全体有限幂零群时,有限生成自由群的子群的pro-V闭包存在有限生成元集,并可以用算法求出。本文的出发点是:对于超可解群类,研究自由群的pro-Su拓扑性质。我们猜想并证明了以下结论:有限生成自
学位
目的 探讨甲功五项联合甲状腺过氧化物酶自身抗体(TPOAb)、抗甲状腺球蛋白抗体(TGAb)检测诊断甲状腺功能减退(甲减)的效果。方法 选取2020年10月—2022年4月在当阳市人民医院就诊的114例甲减患者纳入试验组,同期100例体检正常者纳入对照组。比较2组甲功五项及TPOAb、TGAb水平,同时评估各指标对甲减患者的诊断价值。结果 试验组的血清T3、T4、FT3、FT4水平均低于对照组,血
期刊
教师的课堂讲解行为是教学行为的重要组成部分,学生对数学知识的理解和掌握很大程度上取决于教师的讲解行为.研究新手型教师与熟手型教师的课堂讲解行为的异同,可以为改进相应教师的讲解行为提供有益参考。本文在文献研究法和录像分析法的基础上结合专家咨询意见制定了分析框架,从讲解方式和讲解内容两个方面对新手与熟手型教师在新授课、复习课以及讲评课中的讲解行为进行比较分析,结合教师访谈探寻两类教师课堂讲解行为存在差
学位
目的:探讨甲功三项联合TPO、TGAB在甲状腺功能亢进患者诊断中的应用价值。方法:选取2020-02~2022-02在我院进行检测的80例甲亢患者和80例健康人群分别设为观察组和对照组。患者入院后均对其甲状腺功能三项(FT3、FT4、TSH)和TPO、TGAB水平进行检测,采用ROC曲线分析各指标以及联合检测下的曲线面积,分析诊断效能。结果:与对照组比较,观察组TPO、TGAB、FT3、FT4水平
期刊