基于Bert模型的细粒度短文本情感分析

来源 :天津理工大学 | 被引量 : 0次 | 上传用户:weicun_weicun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网行业和电子商务平台在国内的迅猛发展,以大众点评为代表的第三方点评网站成为了用户在网络上发布反馈信息的集中地。这些评论信息涉及商家属性的情感倾向,一方面可以使消费者通过评论了解商家,选择符合要求的商家进行消费;另一方面可以使商家获取消费者的反馈,及时找到存在的问题,做出相应的优化改善,提高自身的竞争力,制定相应的营销策略来吸引消费者。然而目传统的情感分析只将文本信息包含的情感倾向分为正向和负向。消费者在这种粗粒度的划分结果中难以精准的获取到需要的信息。因此,本文针对在线评论的细粒度情感分析进行了较深入的研究,提出了一种基于Bert:Bidirectional Encoder Representation from Transformers模型和Liblinear:A Library for Large Linear Classification模型相融合的多类别分类方法(简称B-liblinear模型)。该方法利用Bert模型在数据预处理方面的突破性进展对训练文本集进行预处理,获取文本特征,与情感类别标签数据结合,将非结构化的文本数据转化成结构化的训练集合,作为Liblinear模型的标准输入数据,进行分类模型的构建。而Liblinear采用一对多的分类机制,有效的解决了海量数据在多分类任务中的重度数据不平衡问题。本文的主要工作和创新点如下:(1)本文基于Bert模型的特征提取方法,利用Bert模型在多分类任务上的应用,对Bert模型进行微调,将Bert模型的输出,经过CNN进一步提取局部特征,作为下游多分类任务层次softmax的输入。利用该机制可以双向传播的特性,训练模型,更新参数,提取出Bert模型的倒数第二层的特征作为文本特征,用于下游多分类任务,并通过实验证明该方法提取的文本特征的有效性。(2)本文构建细粒度情感分析模型B-liblinear,主要将基于Bert模型的特征提取方法与Liblinear多分类模型相结合,能够在相对较短时间内处理大规模数据的多类别分类问题。并通过试验结果与几种经典的多分类方法以及几种经典的分类模型进行对比。实验结果表明采用B-liblinear处理文本多分类问题时,准确度更高。(3)本文基于Java语言设计并实现了基于Bert模型的细粒度情感分析系统,该系统通过处理分析大众点评美食商家模块的评论数据,呈现出商家的各个细粒度属性信息,用户可以查看商家每一属性的好中差评论的比例以及各类别的评论信息,还可以选择商家进行对比,系统以柱状图的方式直观地显示出商家的属性对比情况。
其他文献
中国是一个历史悠久且邻国众多的国家,在外交方面积累了丰富的经验。近年来,中俄关系日渐友好,越来越密切,两国在各领域的合作不断加深,越来越多的外国学者对中国的外交政策感兴趣,研究中国的外交政策。笔者本次选取了俄罗斯科学院远东研究所经济学教授弗拉基米尔·雅科夫列维奇·波尔佳科夫的著作《21世纪中华人民共和国外交政策》中的节选作为翻译材料。材料中出现了大量的专有名词、外交术语,译者对此进行了查找与分析。
近年来,全球肥胖问题日趋严重,我国6-17岁的儿童和青少年,在过去10年间,肥胖率增长了2倍,肥胖人数近5300万。肥胖不仅影响身体发育,更可能使青少年形成自卑心理,对心理发展造成严重影响。青少年不良的饮食习惯是造成肥胖的一个重要原因,而在众多影响饮食行为的因素中,情绪是一个值得考察的方面。面对消极情绪时,个体增加进食的行为模式被称作情绪性进食。为了解青少年情绪性进食的现状,探究青少年对负性情绪与
随着军事需求和海洋探测需求的增长,水下自主航行器(Autonomous Underwater Vehicle,AUV)在海洋领域的应用越来越广泛。惯性导航系统(Inertial Navigation System,INS)为AUV提供位置和姿态信息,但其误差无可避免的随时间积累。水下地形可以提供额外的信息,辅助修正INS的累计误差。这种水下地形辅助惯性导航是估计AUV准确位置和姿态的可靠手段。本论
人工智能生成内容是否应当受到保护,又应当以何种法律途径对其进行保护等相关问题是目前学术界与实务界探讨的热点。因人工智能生成内容与人类作品具有相似性,故人们讨论最多的就是其是否能够构成著作权法意义上的作品从而通过狭义著作权对其进行保护。但是人工智能生成内容的独创性问题尚存在争议,故适用作品保护模式存在障碍。基于此,有观点提出了邻接权保护模式的思路,但该思路因违背邻接权的立论基础而无法成立。在此基础上
有机碳酸酯是一类用途广泛的化学品,主要包括碳酸二甲酯、碳酸甲乙酯、碳酸二乙酯等等,它们在油漆涂料,有机合成,医药化学,燃料添加剂等领域有广泛的应用。其中,碳酸甲乙酯作为不对称碳酸酯化合物,与其他碳酸酯相比具有显著的优点,是一种新型的锂离子电池的溶剂,能极大地提高电池的能量密度和放电容量。然而在碳酸甲乙酯的生产过程中会产生碳酸二甲酯-乙醇和碳酸甲乙酯-乙醇共沸混合物,使用常规的精馏手段难以对产品进行
人民政协是专门协商机构,把协商民主贯穿政协履行职能全过程是对政协的根本要求。发挥人民政协专门协商机构作用,把协商民主贯穿政协履行职能全过程,内在地就要求把协商贯穿
期刊
目的关于垂直牵引成骨(vertical distraction osteogenesis VDO)增高牙槽嵴的实验研究已多有报道,但传统的牵引器主要存在创伤大、不稳定且成骨形态不理想的缺点。在减小创伤方面报道较少,为了探寻既稳定又创伤小的手术方式,我们使用简单的三根螺钉来实现这一想法。方法新西兰雌性大白兔10只,随机分左侧或右侧为实验侧,牵引单侧下颌,实验侧分别植入两个固定螺钉和一个牵引螺钉,当牵
目前,电力电子设备正在向小型化、高功率密度的方向发展,在电力电子设备中的脉冲功率系统已经越来越多地应用于高新技术领域,这使得脉冲功率系统对半导体开关的开关频率和工作温度有了更高的要求。基于碳化硅(SiC)材料制作的门极可关断晶闸管(Gate Turn-off Thyristor,GTO)具有高电流密度、高阻断电压、高开关频率和高耐热等特点,非常适合作为脉冲开关应用在脉冲功率系统中,但SiC GTO
1.饲料中小肽添加量对大口黑鲈生长、消化和健康的影响本研究旨在探究小肽对大口黑鲈生长、消化和健康的影响。SP0+组(正对照组)为满足大口黑鲈营养需求的基础饲料,SP0-组(负对照组)为在SP0+基础上等比例降低蛋白源用量,使其粗蛋白含量比正对照组下降30g/kg饲料,SP2组为在SP0-基础上添加2%的小肽,但未达到SP0+组粗蛋白水平,SP6.5组为在SP0-组基础上添加6.5%的小肽从而使饲料
光电子器件的微型化、功能化和集成化是驱动信息技术发展的关键因素之一,这要求制备器件所需的光电子材料在纳米尺度上仍能表现出良好的电子和光学特性。二维过渡金属硫属化