基于微博评论的消费券政策情绪分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:handy1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何评估消费券政策的效果是疫情期间的热点话题,由于时效性差、影响因素难以掌握,传统的调查问卷和经济模型很难反映其真实效果,与此同时,大众的各种情绪和态度通过在微博等平台的纯文本评论、点赞等信息行为得到释放。情绪分析是基于自然语言处理的技术,用于从海量文本中了解大众对某一实体的态度。本文从消费者的角度出发,借助情绪分析技术分析微博评论,进而了解消费券政策的响应情况。具体的研究工作如下:第一,文本情绪分类。词向量表示是情绪分类的关键步骤,词向量模型(Word to Vector,Word2Vec)获取的是静态词向量,无法解决一词多义等问题,而基于全词遮掩技术的编码器表征预训练模型(Pre-Training with Whole Word Masking for Chinese BERT,BERT-wwm)充分学习了上下文的语义信息且考虑到了中英文的差异。本文以提升情绪分类的准确率为目标,采用BERT-wwm与卷积神经网络(Convolutional Neural Networks,CNN)相结合的方法,构建了BERT-wwm-CNN模型对爬取的微博文本进行分类,并借助评价指标对比分类效果。第二,文本主题挖掘。潜在狄利克雷分配模型(Latent Dirichlet Allocation,LDA)能进行隐式语义分析,可以用于识别文本语料库中包含的主题。为了快速从大量文本中了解到网友关心的话题,本文借助LDA模型,研究了郑州两期消费券政策的网友微博评论内容的主题变化并分析可能产生这种变化的原因,同时发现郑州第二期消费券门槛过高可能是导致消费券被非法套现的重要因素。此外,本文将LDA模型的主题对应词与文本情绪分类模型结合,观察分类模型剔除主题对应词与随机词后的分类效果,实验结果表明LDA模型中的主题对应词是影响情绪分类模型分类效果的关键词。
其他文献
脑机接口的研究不仅仅有利于人类对大脑的工作机制的了解,而且在生物医疗康复,生活娱乐等领域都有着很重要的实际应用价值,其中研究脑电信号的分类算法的性能对于提高脑机接口的工作效率是十分关键的。由于深度学习具有非线性结构,近年来越来越多的学者将深度学习融入脑电信号的分类算法中。本文主要研究的脑电信号的分类模型为卷积相关分析模型,该模型结合了深度学习中的卷积结构以及统计学中的相关分析,并对该模型进行了两项
学位
T细胞急性淋巴细胞白血病(T-cell acute lymphoblastic leukemias,T-ALL)临床罕见,预后极差。我们报道1例初发Ph阳性T-ALL,应用多药化疗联合国产第2代酪氨酸酶激酶抑制剂(tyrosine-kinase inhibitor,TKI)氟马替尼治疗疗效显著,初次诱导后获完全缓解(CR),5个月时流式微小残留白血病(minimal residual diseas
期刊
新冠肺炎疫情是2020年对中国经济具有较大影响的事件,对我国第三产业,即服务类行业的影响较大。我国股市的走势会在新冠疫情爆发期间产生震荡,总体呈向下趋势。学者们发表过许多研究股票市场的论文,所有的论文都主要关注如何根据一个价格的以前的价值来描述一个价格的潜在生成过程的问题。在任何两篇论文中所使用的数据几乎是不相同的,各种模型都是通过使用非常复杂的统计技术进行研究的。从单一的统计学方法模型、单一的机
学位
在金融领域,股票价格预测和投资策略一直是热门的研究话题,股票价格本身受到多方面因素的综合影响,是一种复杂的非线性系统,传统的统计学方法难较准确的预测股价,使得股票价格预测成为难点。看似无序的股价实际存在规律,是具有混沌性的,相空间重构(Phase Space Reconstruction,PSR)主要处理混沌时间序列,能够在高维空间中得到序列的潜在规律,与长短期记忆(Long Short-Term
学位
随着我国金融衍生品业务的飞速发展,场外金融衍生品的交易规模越来越庞大,其定价问题也成为研究热点,尤其是近两年来,阶梯型雪球结构产品从场外金融衍生品中脱颖而出,得到了广泛的市场关注。但是投资者对阶梯型雪球结构产品的接受程度大,不代表对产品的风险程度有明确的认知,更需要将产品的定价透明化,避免投资者盲目投资造成资金严重亏损。不过由于其产品结构的复杂性,在应用传统定价模型进行定价时具有较大困难,也难以把
学位
股票市场行情的表现与国民经济发展的状况密切相连,是企业和经济未来增长预期的快照。然而股票市场瞬息万变,其价格变化规律难以把握,如果把控不好,会面临很高的风险,甚至会对实体经济产生冲击。因此,提前把控好股票价格的变动具有十分重要的理论意义和现实意义。股票市场作为一个非常复杂的非线性系统,具有高噪声、非平稳和多个时间尺度的问题,使得仅依靠单一模型预测股价变得有些困难。本文构建了一种新的多尺度非线性集成
学位
随着全球经济的快速发展,如何控制碳排放的增长一直是困扰世界的问题。虽然受疫情影响,2020年碳排放量小幅下降。但随着全球经济复苏加速,当前的气候与能源政策仍不能有效地改变全球碳排放的增长。而发展可再生能源已经成为世界各国一个重要的战略方向。中国提出了“碳达峰”和“碳中和”的目标,因此中国非常有必要以新能源替代传统能源,以清洁能源驱动社会可持续发展。以电力部门脱碳为目标的向可持续能源资源的过渡已引起
学位
忆阻器作为基本电路元件之一,在许多领域有着巨大的应用价值。同步性问题是随机微分方程领域一个重要的研究方向,在大规模集成电路、信号波、随机存储器等实际工业应用中,两个或多个系统能否在一定时间内实现同步,是影响系统性能的关键因素,本文对随机忆阻神经网络在固定时间内的同步性问题展开研究。首先,利用集值映射、微分包含理论和模型变换,将驱动-响应系统的同步性问题转化为偏差系统的稳定性问题。其次,对于随机忆阻
学位
胃癌严重威胁人类健康,超过70%的初诊病人已属进展期或伴转移。目前存在“三高”现象:进展期胃癌比例高,不必要的剖腹探查率偏高,以及非R0切除率偏高。腹腔镜探查可发现:(1)腹腔内隐匿、影像学检查无法诊断的微小转移病灶;(2)明确已侵犯邻近脏器;(3)通过腹腔灌洗发现腹腔游离癌细胞,从而精准分期以确定合理的治疗方案。明确T4b分期,采取积极的术前治疗。发现腹腔隐匿性转移灶,避免过度治疗。筛查脱落细胞
期刊
人们对下一代工业机器人的期望之一是协作机器人(Cobot).Cobot是一种能够与人类操作员在同一工业任务上无缝协作的机器人助手。机器人需要根据人们的情绪来做出相应的反应,即情绪识别。脑电图(EEG)是情绪识别中最常用的生理信号,因此,很多研究用EEG信号来进行情绪识别。然而,人们处于某个特定的情绪的时间比较少,例如恐惧检测,处于恐惧状态的数据很少,这就造成了数据不平衡情况,对这种不平衡的EEG信
学位