基于CNN-BILSTM网络与BERT的舆情分析算法

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:p_pppoe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体的兴起使抖音、微博等日益渗透到人们的生活中,用户能够随时随地的在网上查找自己感兴趣的信息并进行分享讨论。互联网舆情是带有较强影响力和倾向性的民意的综合反应,由于舆情消息爆炸式的递增且格式多种多样,所以通过对海量舆情的处理分析快速精准了解民意并建立起全方面,高效率的舆情监管机制,提高舆情判断的准确率,使互联网健康稳定发展具有重要的现实价值与研究意义。舆情分析主要包括对海量信息的自动抓取,主题检测,行业分类,情感分析等内容。为了提高舆情分析的准确度和效率,本文主要的研究内容包括以下两个方面:1.文本的行业分类。由于文本在结构上存在着上下文之间的依赖,CNN擅长对局部特征进行提取而无法获得上下文的含义,RNN由于存在梯度问题无法保证分类的准确率。为了弥补这些神经网络的不足,本文将CNN与BILSTM进行融合,首先将获取的文本进行分词,然后使用word2vec技术将词语进行向量化处理,利用CNN提取局部特征的同时,并且使用BILSTM模型进行双向特征学习提取文本的全局特征,经过组合后使用Soft Max层计算出正确的类别。本文提出的算法在精确率precision,召回率recall和F1值这些评价指标上均有不错的表现,使得文本行业分类的准确率得到显著提高。2.文本的情感倾向分析。由于短文本语料短而又特征发散,基于字典的传统情感分析方法对构造词典的质量依赖较强,简单的深度学习模型不能有效处理上下文相关的语义理解。为了更好的抽取文本特征,本文采用BERT-CNN模型进行舆情的情感分析。首先通过BERT模型获取到词向量,通过CNN网络进一步提取句子中的高阶特征和特征降维,加入随机Dropout防止过拟合,然后把输入到全连接层的特征向量由softmax函数计算出情感类别。经实验表明,该方法与Text CNN,Bi Lstm,Bi Lstm+Att等算法相比能够很好地提高情感分类准确度。
其他文献
近年来,随着制造业的转型和成熟,医药业、食品业、物流业及计算机,电信和家用电器等3C产业等行业变得活跃起来,许多行业的生产已从变化不大的大批量产品转移到了高混合量的小批量产品,这就需要构建一个灵活而高效的制造系统。传统的工业机器人需要单独的工作空间且价格高昂,无法满足时代的需求。既可以独立工作又能与人类协作的机器人——协作机器人已经成为时代的需要。鉴于协作机器人工作场所及工作内容,对其稳定性、安全
覆盖于圆柱细丝壁面的液体薄膜流动是自然界中普遍存在的物理现象。纤维细丝流体覆膜流动的动力学特性将会对涂覆工艺的质量产生巨大影响。在涂覆的过程中,纤维细丝上液体的流动特性是决定镀膜质量的重要因素,通过了解纤维细丝上覆膜的流动特性,可实现精确调控覆膜的形貌和结构。因此,开展圆柱细丝上覆膜流动的动力学特性研究,探索控制界面稳定性和动力学行为新方法,具有重要的科学意义和工程应用价值。本文针对圆柱细丝上高粘
本论文将放电等离子体烧结技术与球磨法相结合制备了具有好的放氢性能和抗氧化能力的Al-Bi-CNTs、Al-BiOX(X=F、Cl、Br、I)和Al-Bi2O2CO3三种制氢材料。分别测试了它们的产氢性能,并通过XRD、SEM-EDS、TEM-SAED、XPS和理论计算等手段对它们的产氢机理进行了研究。首先,采用球磨加放电等离子体烧结法制备了Al-Bi-CNTs材料。发现经SPS烧结后的Al-Bi-
随着经济社会的不断发展,整个社会的产业结构也在不断升级,工业社会最显著的特征就是生产场所转向室内,因此现今对室内环境的要求越来越严格,在要求室内环境卫生的同时还要求室内环境有很高的人体舒适度。空气的温度和湿度是影响室内环境舒适度的两大主要因素,在中国南部地区每年3、4月份时的回南天和7、8月份时的梅雨季,环境湿度都会陡增,人体在这种环境下体感舒适度会降低;同时过高的湿度非常容易滋生各种有害微生物,
针对6R关节型机器人在上/下料过程中存在生产效率较低、偶然发生机械碰撞以及运行过程伴随振动的问题以及基本鲸鱼优化算法存在的收敛精度低、易陷入局部最优解等不足,本课题提出一种改进的鲸鱼优化算法,并基于改进的算法对6-DOF串联型工业机器人进行运动分析及轨迹规划的研究。本文主要对课题中鲸鱼优化算法改进部分的关键技术进行了研究,并对工业机器人进行了时间最优轨迹规划。首先,基于标准D-H法对研究本体建立关
数字时间转换器(DTC)是一种根据数字信号控制实现不同的输入到输出延时的电路,可用于调整关键信号路径的传播延时。利用DTC可以相对地提高时间分辨率,在最近几十年,DTC越来越受到学术界和工业研究的关注,其主要应用在频率合成和有线/无线发射机和接收机等领域。DTC与传统的数模转换器(DAC)相似,重要的性能特性包括动态范围、分辨率、精度、非线性和单调性,也包括功耗和抖动或相位噪声。本论文主要研究一种
Na0.5Bi0.5TiO3(NBT)基无铅陶瓷由于其自发极化铁电特性,在铁电储能、铁电催化、铁电光电等交叉领域持续受到研究人员的关注,有望在换能器、传感器、存储器和光电器件等领域得到应用。NBT陶瓷的氧八面体结构将电荷、自旋、极化强烈的耦合在一起,产生丰富的电学、光学、磁学、储能物理等特性,通过掺杂NBT陶瓷从而调控其微观结构及性能是一种有效途径。本研究通过设计B位Mo,Nb,Ta掺杂,采用传统
随着人工智能的普及,生活中的方方面面都应用着计算机视觉技术。场景文本检测是计算机视觉领域的基础任务,通常与文本提取、文本识别等技术相结合,应用在智慧城市、智能辅助驾驶、视障人士导盲等领域中。当前,对文档图形进行检测主要使用的是通用检测器,但复杂的背景环境以及场景文本行的扭曲等条件会导致大量漏检、误检问题的出现。为克服场景文本扭曲等复杂现实问题以提升文本检测效率与质量,本文结合通用检测模型和卷积神经
随着GPS智能移动设备和移动计算的快速发展,基于位置的服务(Location Based Service,LBS)在物联网应用中越来越受青睐。智能终端和定位技术的更新和升级,旨在为用户和服务商之间提供通信载体进行信息交互。然而人们沉浸在互联网时代源源不断带给其便利的输入时,也在不知不觉地将个人隐私进行输出。轨迹数据未经处理直接发布,是泄露用户隐私的最直接途径。攻击者不仅可以获得移动对象的位置分布和
食品溯源系统是确保食品安全的重要手段,并在食品安全领域发挥着重要作用。压缩感知理论的出现打破奈奎斯特采样定理对采样频率的限制,只需少量的采样点就能重构出精确度较高的原始信号。测量矩阵的设计在压缩感知理论中起着关键作用,其性能影响着信号的采样与信号重构的精确度。为提高食品溯源系统中数据的重构精确度,本文对压缩感知测量矩阵的设计展开研究。由于混沌系统产生的混沌序列具有良好的伪随机性,可将其用于压缩感知