基于BERT和层次化Attention的微博情感分析研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:liuliyuanll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博情感分析旨在挖掘网民对特定事件的观点和看法,是网络舆情监测的重要内容.目前的微博情感分析模型一般使用Word2Vector或GloVe等静态词向量方法,不能很好地解决一词多义问题;另外,使用的单一词语层Attention机制未能充分考虑文本层次结构的重要性,对句间关系捕获不足.针对这些问题,提出一种基于BERT和层次化Attention的模型BERT-HAN(bidirectional encoder representations from transformers-hierarchical Attention networks).通过BERT生成蕴含上下文语意的动态字向量;通过两层BiGRU分别得到句子表示和篇章表示,在句子表示层引入局部Attention机制捕获每句话中重要的字,在篇章表示层引入全局Attention机制以区分不同句子的重要性;通过Softmax对情感进行分类.实验结果表明,提出的BERT-HAN模型能有效提升微博情感分析的Macro F1和Micro F1值,具有较大的实用价值.
其他文献
目的 针对传统建模方法在预测的翘曲变形位置与实际偏差较大的问题,开展基于Moldflow的注塑成型制品翘曲变形优化建模分析研究.方法 通过数据模拟分析预处理、浇注体系模型构建、基于Moldflow的注塑成型制品翘曲变形过程模拟等手段,实现对注塑成型制品曲面参数优化.结果 通过对比实验证明,新的建模方法与传统建模方法相比预测翘曲变形位置偏差更小,预测结果更准确.结论 在实际应用中,该建模方法能够辅助塑件加工厂提升注塑成型制品生产质量.
法定计量技术机构测量设备的有效管理是保证量值准确可靠、提升质量和工作效率的重要手段,本文从体系管理、使用维护、期间核查等方面介绍了加强测量设备管理的方式方法;从标准物质的选择、保管、使用等方面阐述了确保标准物质量值准确的注意事项.通过本文论述,以期为顺利开展计量工作,提升实验室检测技术和管理水平提供理论基础.
为解决嵌入式领域对处理器不同性能面积的需求,以及对重排序缓冲区阻塞,保留站派遣长短周期指令时导致的吞吐率不平衡及堵塞问题,设计并优化了一种简便配置的参数化流水线超标量处理器.通过定制化流水线中的分支预测,缓存与运算单元,将RISC-V指令划分5大类处理,对不同周期的执行单元采用级联与并行的混合分布方式,将充当排序缓存中的指令再派遣,达到指令暂存和分类执行的目的,使一条不定周期指令可以携带多条单周期指令提交.缓存之间以直连方式进行通信,以避免复杂的公共数据总线以降低时序损耗.实验结果表明,该处理器可以通过配
今年这个冬天,多地都出现了银装素裹的美丽雪景,那么雪究竟是何模样?rn它是如何产生的?对我们的生活又有哪些影响呢?rn雪花规格rn古人常言“草木之花多五出,独雪花六出”.rn雪花,一种晶体,是天空中的水汽经凝华而来的固态降水,结构随温度的变化而变化,在飘落过程中成团联结在一起,形成雪片.单个雪花的大小通常在0. 05 ~4. 6毫米之间.雪花很轻,单个重量只有0. 2 ~0. 5 克,5000~10000朵雪花堆积在一起才有1 克重,而1 立方的新雪通常有60亿到80亿朵雪花.
期刊
网络靶场是用于网络空间安全研究,利用计算机仿真技术创建的高度近似于真实网络空间运行机制的可信、可控、可定制的重要基础设施.结合网络空间安全发展态势,归纳分析并重新定义了网络靶场的概念,提出了网络靶场的基本服务能力.立足体系结构、实现技术和功能需求等属性特征,选择目前具有代表性的典型网络靶场进行了分析.在此基础上,重点从大规模网络仿真、网络流量模拟及用户行为模拟等方面,讨论了网络靶场的关键技术.着重从技术和应用方面讨论了网络靶场的发展过程与趋势,并对我国网络靶场的现状与发展作了必要探讨.
近些年,老年人的健康问题越来越受到重视,跌倒作为影响老年人健康安全问题的主要原因之一,其研究热度一直居高不下,高质量的跌倒检测算法层出不穷.总结了跌倒检测的研究意义和现有的热门研究方法,分别从单一算法和混合算法的角度概述基于阈值、机器学习与深度学习三个方面的跌倒检测算法,介绍各算法的检测方式、判定方式、总体性能和各类单一算法的优缺点,并且从时间、空间和时空三重维度重点阐述了卷积神经网络在跌倒领域发挥的显著作用及应用;同时介绍了跌倒检测算法所使用的数据集及其特点,便于研究者了解跌倒检测在阈值、机器学习与深度
针对软件定义网络(software defined network,SDN)中控制器发生故障问题,提出了一种基于多种群粒子群算法的SDN控制器故障恢复策略.从其他正常工作的子控制器集合中挑选出能够容纳失控交换机负载的备份控制器集,将精英种群与子种群组成多种群粒子群,采用预选和交互机制演化出备份控制器的最优位置,以保证交换机与控制器之间的传播时延最小,完成失控交换机的迁移.实验结果表明,相比于现有的控制器故障恢复算法,该算法在恢复时间、控制器负载利用方面均有所提升.
针对社会化推荐算法中存在的推荐准确率不高的问题,提出了一种多头注意力门控神经网络(MAGN)算法.具体来说,采用门控神经网络对输入的用户和用户-朋友对进行融合得到联合嵌入,利用注意力记忆网络来获取不同朋友在不同方面对用户的影响,利用多头注意力来获取在不同方面对用户影响程度偏高的几位朋友.采用门控神经网络将朋友影响和用户自身兴趣偏好进行混合,继而基于混合兴趣偏好对项目进行推荐.在两个公开真实数据集上进行实验进一步验证了所提方法的有效性.
针对传统协同过滤推荐算法普遍存在的数据稀疏性问题以及寻找相似用户时存在局限性,提出一种融合狼群算法和模糊聚类的混合推荐算法.在数据处理过程中,根据基于项目的协同过滤算法充分挖掘项目间的数据关系,填充原始矩阵的零值以降低数据稀疏性;从用户的角度出发,根据模糊聚类隶属度的大小筛选出相关邻居集合,扩大相关用户的寻找范围;将狼群算法引入模糊聚类,借助狼群算法全局搜索的优势,提高寻找相似用户的准确度.在真实的数据集上进行对比实验,结果表明,所提算法缓解了数据稀疏的问题,推荐误差明显减小,和传统的推荐算法相比有着良好
为了解决信息过载问题,提出了一种融合知识图谱与注意力机制的推荐模型.在该模型中,将知识图谱作为辅助信息进行嵌入,可以缓解传统推荐算法数据稀疏和冷启动问题,并且给推荐结果带来可解释性.为了提升推荐准确率以及捕捉用户兴趣的动态变化,再结合深度学习中的神经网络以及注意力机制生成用户自适应表示,加上动态因子来更好地捕捉用户动态兴趣变化,使用多层感知机对项目进行评分预测.在MovieLens-latest-small电影数据集和豆瓣数据集进行仿真验证,结果表明该模型进行TOP-K列表电影推荐相比于其他算法拥有更好的