基于BERT和注意力机制的短文本情感分析研究与设计

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:arthurzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数字化、网络化、全球化的发展趋势下,互联网技术得到了飞速的发展。在互联网技术的众多产物中,各种各样的网络信息平台为人们发布和接收信息提供了更低的门槛。社区中的各种电子商务平台作为重要的网络信息媒介,包含了大量民众的消费感受和体验信息,这些信息绝大多数都以短文本的形式出现,并且能够很大程度上反映民众真实的感受和想法。因此,对这些信息文本进行快速有效地处理分析、挖掘其中的情感倾向,无论是对于提高用户体验还是对于增加商家的经济收入都有着重要的意义。本文的主要工作内容如下:1.对短文本情感分析方法进行研究与改进。使用BERT模型替代传统的词向量训练方法,使得得到的词向量能够更好地表达词的含义,并且针对短文本特征稀疏的特点,在BERT模型中融入CTM主题模型得到的主题信息,为下游任务提供更高质量的词向量。在Bi-GRU神经网络中引入注意力机制,提高情感分析的准确性;通过引入池化层,加快网络的拟合速度;使用真实文本情感分析数据集进行训练,将一些较为优秀的情感分析算法与本文改进后算法进行对比。实验结果证明,本文的算法准确率为94.12%,相较于其它进行对比的模型准确率有一定程度的提升,同时模型的拟合速度也快于改进前模型。2.对短文本情感分析软件进行设计。软件基于B/S架构进行设计,首先对软件的需求进行了分析,其次根据需求对软件数据库进行设计,然后对软件的具体业务功能进行设计,最后通过Spring Boot框架对软件中的各个逻辑功能进行实现。短文本情感分析软件主要包括用户登录注册、查看修改个人信息、查看日志信息、短文本情感分析等功能。3.对短文本情感分析软件进行相关的测试工作。根据短文本情感分析软件的功能与非功能需求,参照国家软件质量测试标准GB/T25000.10-2016,搭建软件测试所需要的环境对软件进行测试。测试中,针对软件的不同功能设计不同的测试用例进行测试,同时使用JMeter测试工具对软件性能进行测试。测试结果表明,用户可以正常使用软件中的各个功能,并且软件的各项性能指标也符合其国家标准。
其他文献
WIA-PA协议作为重要的工业无线网络协议之一,研究针对WIA-PA协议的漏洞检测方法对于工业控制系统的安全稳定运行具有重要意义。模糊测试技术是一种有效的漏洞检测技术,现有的模糊测试方法在对WIA-PA协议进行测试时存在测试数据冗余,漏洞检测效率低等问题。为此,本文针对WIA-PA协议开展模糊测试方法的研究,本文的主要研究内容如下:首先,针对现有模糊测试方法测试数据冗余,漏洞检测效率低等问题,本文
学位
<正>1引言本文围绕着“生活中的三角函数”这一主题,以数学建模流程为主线,谈谈高中数学建模教学的设计.本次教学共两个课时,包含两个具有阶梯性的数学建模活动,其中第一个活动指向数学建模素养的水平二,第二个活动指向数学建模素养的水平三(水平的划分和课程标准一致).首先,根据潮汐曲线图的特征,教师引导学生选择三角函数模型进行拟合,让学生体验数学建模的过程,用数学的语言表达世界.随后,教师通过学生活动,
期刊
伴随着国家持续推进智慧社区建设,使社区信息系统的发展步入正轨,但大多社区信息化的系统孤立导致了各个系统间仍存在诸多问题,其中包括社区文件的难以共享、系统的修复以及管理成本高、系统读取数据慢等问题。目前智慧社区的文件系统仍不够完善,所以针对Ceph系统缓存策略以及数据修复的策略进行了改进。本课题主要工作如下:1.针对Ceph分布式系统缓存社区文件命中率不高的问题,本课题通过分析Ceph分布式缓存原理
学位
自主驾驶车辆是一类可以感知工况、规划行驶轨迹并进行轨迹跟踪的移动机器人,现阶段自主驾驶技术的发展因两点需求越来越引人注意,一是降低交通事故的频发性,二是增加交通的有序性以方便智能交通网络的建立。本文借助模型预测控制在处理物理约束和高阶时变系统时的优势,采用李雅普诺夫稳定性理论和Schur补引理等辅助工具系统性地研究了自主驾驶车辆在现实生活中可能遇到的三类问题,这三类问题分别为给定轨迹跟踪、主动转向
学位
现实生活中,由于利用成像设备直接获取或改变图像的质量往往需要投入大量的财力,因此人们为了能够获取高质量的图像,相继提出了很多有关图像重建和图像去噪的技术和算法,为图像的重建等技术奠定了坚实基础。现代以来,随着图像数学理论的深入研究,人们发现将分数阶微积分理论引入到基于偏微分方程的图像重建过程中可以很好地消除重建过程中噪声和阶梯效应的影响,这也极大促进了偏微分方程的研究与发展。本文主要在分数阶图像超
学位
可控攀爬机器人在林业、军事侦察、大型基础设施(如高空路桥、桁架)的健康监测领域具有极其重要的意义。与无人机相比,攀爬机器人具有负载能力强、续航时间长等优点,能够贴近建筑表面进行近距离检测作业。传统攀爬机器人多为刚性结构,以磁吸式、真空吸附式、爪刺式为主。近几年,通过对尺蠖等生物运动行为及黏附机理的研究,基于智能黏附材料的仿生软体攀爬机器人受到学术界的关注。然而,传统攀爬机器人普遍存在体积笨重、壁面
学位
<正>1978年,Louise Brown的出生表示辅助生殖技术(assisted reproductive technologies,ART)的范围已大大拓宽[1]。虽然胚胎和精子冷冻保存都已经是较为成熟的技术,但因为技术问题和较低的成功率,卵母细胞冷冻领域在很长时间内缺乏进展[2],1980年代后期,首次使用慢速冷冻和快速解冻冷冻保存技术,冷冻卵母细胞才首次成功受孕[3-4]。因为卵母细胞的表
期刊
摩擦磨损现象在工业生产中不可避免,其带来的损耗已经对人们的经济生活造成了巨大的损失。为此,学者们提出了不同的摩擦调控手段,如添加润滑剂等,并且取得了极大的进展。然而,传统的摩擦调控手段只能实现增大摩擦力或者减小摩擦力,无法做到在线的、可逆的实时调控。这在一定程度上阻碍了智能设备的发展。如何实现对摩擦的主动调控成为一个关键问题。磁敏橡胶因其具有良好的磁场可控特性,在磁场的作用下,其刚度、模量将发生改
学位
随着大数据时代的到来,物联网、云计算、人工智能等新兴技术蓬勃发展,信息技术的革新不仅给人类生活提供了便利,也造成了数据的复杂多样。若直接对原始数据进行分析和处理已变得不太现实,一方面高维数据信息混杂,无法直接进行数据分析;另一方面数据维度空间的膨胀问题愈发严重。因此,针对高维数据的研究已成为一个重要课题。降维作为一个预处理阶段来挖掘隐藏在输入数据中的有用信息,可以有效地去除冗余数据,降低数据复杂度
学位
目的 分析南昌市2015—2021年抗病毒治疗持续时长超过6个月的HIV/AIDS病毒学失败率及其影响因素,为综合评价和及时干预提供参考。方法 采用回顾性分析方法,收集2015—2021年国家艾滋病综合防治信息系统、中国疾病预防控制信息系统以及南昌市定点医院的HAART相关数据资料,分析患者HAART病毒学失败的影响因素。结果 共纳入研究对象1 690例HIV/AIDS,病毒学失败率5.76/10
期刊