基于多头注意力和BiLSTM的微博情感分析——基于“三孩政策”案例研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:madeshabi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着宽带等网络基础设施的建设和智能手机的全面普及,以微博为代表的社交媒体逐渐成为人们日常共享信息的重要平台。微博庞大的活跃用户群体和开放互通的特点使得每个人都成为信息的传播者,极大地提高了信息传播的速度、深度和广度,为舆论发酵提供了得天独厚的条件基础。因此,微博舆情情感分析对于舆情的疏导管控、网络秩序的维护有着极其重要意义。当下的微博情感分析通常是把单个博文作为一个整体来分析,在分析时大多局限于字或词的感情色彩,没有考虑词语之间的关联性,而且对于类别不平衡问题一般都是运用重采样来解决,导致对困难样本的分类关注不足。因此,本文提出一种基于多头注意力的BiLSTM模型,并引入Focal Loss作为损失函数,旨在提升模型的情感分析性能。本文以“三孩政策”这一微博舆情事件为例,通过BiLSTM提取微博词级特征,结合多头注意力学习不同子空间中的特征权重分布,有效捕获句子的情感信息,最终获得整篇微博的情感分类。实证结果表明,本文提出的模型情感分类效果明显、优势突出,并提高了对类别不平衡样本和困难样本的学习能力。本文在对“三孩政策”整体情感倾向的研究基础上,通过进一步采集详细信息并利用绘图技术进行了情感的可视化分析。研究结果发现,舆论爆发呈现迅猛集中的特点,主要表现在微博数量急速达到峰值;官方微博的引导有助于积极和理性情绪的产生;从性别来看,女性对于“三孩政策”的抵触情绪要略强于男性;从地区来看,“三孩政策”在发达地区的热度要高于欠发达地区,但是负向情绪值与地区发达程度无明显关系;就情感聚焦分析而言,晚婚晚育甚至不婚不育观念的盛行、职场高强度的竞争、用工单位对女性的歧视、高昂的生活成本、配套政策的不系统不到位和生育限制措施的取消不及时是导致网民对于“三孩政策”负面情绪占比高的主要原因。最后,本文针对情感分析模型的不足之处进行了分析,在加强利用非文本有效信息、细化文本情感分析粒度和关注多层粒度文本结构三个角度提出了改进建议;同时,就情感可视化分析,本文认为舆论的疏导和管控应当从及时公开信息、开通政民服务平台和满足民众诉求三个方面进行优化。
其他文献
在线投资组合策略研究是量化策略研究中很重要的部分。在中国投资热情高涨,成交额破万亿时有发生,利用量化策略为投资者构建良好的投资组合,让人们能够分享到中国的财富增长,显然具有很强的现实意义。同时,从“风险”这一角度出发,给该领域的研究者提供更多维度的信息,为在线学习领域的学者提供一定的参考。在线投资组合领域经常被提到的是Cover(1996)等人提出的泛投资组合,而关于泛投资组合最知名的当属Helm
学位
随着社会分工的逐步深入和科技的不断发展,社会职位结构和工作岗位也会越来越精细化。针对该种状况,一方面,公司要求在最有限的成本下迅速寻找专业化的工作人员,另一方面,求职者们又期待能够迅速寻找并匹配到理想的工作岗位。因此人力资源供需双方都需要通过网络招聘平台提供更专业、细致的服务。但由于当前主要的网络招聘平台都是对多行业或者全行业覆盖,往往很难满足这类需求。为了解决此问题,本文通过实体关系抽取技术提取
学位
数字经济是大数据应用下的新经济形态,它透过利用信息的“识别—选择—过滤—存储—使用”这一功能途径,推动、促进信息资源的快速综合优化分配和经济效率高速发展。近年来,数字经济已经上升为国家战略,大数据、云计算、人工智能等新型数字信息技术也蓬勃发展。数字经济迅速兴起的今天,数字经济作为一个新型创新产业,涉及知识迁移、人才流动和社会经济关系等问题,往往存在着空间溢出属性,并呈现出空间聚集的特征。数字经济产
学位
随着互联网的发展,人们的信息获取需求已经不仅仅依赖于传统的工具如电视、报纸等,人们更关注信息的实时性,于是,网络视频在互联网浪潮中逐步发展起来,以哔哩哔哩视频网为首的视频平台在互联网的洪流中相互竞争,共同增长,另一方面,我国的网络视频用户规模也在不断增长,长短视频用户渗透率均不断增强,视频创作者也越来越多。本文以哔哩哔哩视频网站为例,采用网络爬虫方法爬取其视频数据,基于数据分析与挖掘的方法,对B站
学位
在国内国际双循环的新发展格局下,提升居民消费水平及质量成为我国扩大内需的重要切入点。然而,农村居民受到自身资本积累的限制,难以获取有效的金融服务支持,进而导致农村消费市场增长缓慢,各省市内部城乡消费水平依旧存在显著的差距。在数字经济持续发展的背景下,我国大力推动数字普惠金融服务建设,以期通过创新的金融产品和良好的金融市场环境缓解二元经济结构下的金融排斥现象。因此,如何通过发展数字普惠金融加速农村地
学位
近些年来,互联网金融迅速发展,互联网借贷成为互联网金融发展最为迅速的模式,在互联网借贷规模快速扩大的同时,风险管理问题也日益突出。信用评分卡模型作为广泛应用的风控模型之一具有完善的理论基础和丰富的实践意义。但随着大数据时代的到来,用户的信息特征维度也逐渐变多,如何对海量的用户信息进行挖掘,充分发挥人工智能在用户违约预测上的作用,对于提高互联网借贷的风险管控能力,进一步促进互联网小额贷款公司健康发展
学位
乳腺癌作为现如今全球女性最常见的癌症,提高其疗效的关键在于早期发现、早期诊断。目前乳腺癌的筛查主要还是借助于乳腺X线摄影技术,但仅依靠该项技术并不能够准确地筛查出乳腺癌,容易出现误判为乳腺癌的情况。为提高乳腺癌筛查的准确性,有助于乳腺癌的早期发现、早期诊断,本文利用生物标记物——基因启动子区域的甲基化水平对乳腺癌样本进行识别,从而给出一个更为精确的预测结果。本文从TCGA数据库中收集了892个样本
学位
在我国消费市场正迅速增长的背景下,国家统计局的数据却显示出2020年消费下降了 3.9%,拉低了 GDP增长速度,这种现象的发生,能够联想到最直接的因素就是当下疫情所导致的居民消费需求不足。从不同的角度可以针对居民消费现象进行量化的描述,根据消费者信心是能够反应整个国家在短时期内居民消费需求的一个重要指标,因此本文将消费者信心指数作为研究对象,该指数可以为消费者群体对于未来一段时间内收入、支出预期
学位
随着经济全球化,现代科学技术的快速发展,物流业已由传统物流在不断向现代意义上的物流转变。在当前物流业飞速发展的大环境下,建立综合物流业指数体系已是必然选择。但目前我国缺少对物流业综合指数深入探讨,物流业综合指数体系不够完善。探究物流业生产指数的编制方法,既可以完善我国物流业统计内容,又是衡量我国物流业发展规模和综合服务能力的有效途径之一。本文基于国内外编制生产指数、交通运输服务指数的思路,结合我国
学位
互联网高速发展的时代催生了在线职业教育这一行业,也催生了在线评论这一表达观点的形式。我们可以从评论中挖掘出有价值的信息,比如该产品的特点属性和用户对其的情感态度如何。用户可以通过在线评论了解产品的优缺点,以便于做如何选择和购买的决策;行业可以从在线评论中挖掘出用户对产品各方面的态度,以便于进行针对性的改善。本文主要探讨以下问题:用户对在线职业教育产品是何种态度,当前产品的痛点和赞点主要有哪些。本文
学位