基于文本挖掘的热点事件舆情分析 ——以地摊经济为例

来源 :天津商业大学 | 被引量 : 0次 | 上传用户:maradonaargentina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
2020年突如其来的一场疫情,打乱了所有人的节奏。为了缓解疫情给社会带来的影响,保证经济市场的正常运行,刺激消费,缓解就业状况,地摊经济再次回到大众的视野。自从2020年5月27日,地摊政策松绑以来,有关地摊经济的话题瞬间冲上了顶峰,很多人积极响应国家的号召,开启了自己的摆摊之路,地摊经济迅速走红,成为民众热议的话题。但是在不到半个月的时间内,地摊经济又火速降温,又恢复了之前的样子。在不到一个月的时间内,地摊经济从如火如荼地开展到迅速冷却,分析这段时间有关地摊经济的舆情话题,将有利于我们发现地摊经济的问题,更加合理的开展地摊经济。本文以“地摊”作为关键词,利用网络爬虫技术爬取了2020年5月26日到2020年6月30日的用户微博数据,总计22368条,对此数据进行文本挖掘分析。利用词云图、语义网络分析等,挖掘各阶段民众关注焦点,为后续研究民众情感倾向奠定基础。采用四种分类模型,进行建模分析,利用相关指标评估模型优劣,最后选择Adaboost最优模型,预测公众情感走势,公众对地摊经济大多持有理性的看法。相关部门可根据公众关注内容及公众情感进行相应的调整,科学引导地摊经济的开展。本文的主要内容以及研究结论如下:(1)以“地摊”作为微博搜索的关键词,利用网络爬虫技术爬取2020年5月26日至2020年6月30日的用户微博数据,总共爬取了微博数据22368条,根据爬取的原创微博数据进行后面的研究分析。(2)对文本数据进行预处理,包括数据清洗、去除停用词、文本的分词处理等,选择Word2vec方法对文本进行向量化处理。(3)对文本数据进行语义挖掘分析,对词频进行统计分析,制作各阶段的词云图,制作语义网络图,整理高频关联词,分析民众的关注内容,找到高频词之间的关联关系,进一步挖掘文本的情感,为后续情感研究提供依据。(4)选取部分文本数据进行人工标注,将文本情感内容分为消极、中性、积极三种类别。本文选择使用Adaboost、GBDT、XGBoost、LSTM四种算法对文本进行分类训练,从训练结果得出,Adaboost模型表现最好。因此本文选择Adaboost模型对剩余文本进行预测,对预测结果进行整合,得出结论。在三个发展阶段中,中性的情感占比最多,并且占比越来越高,民众对地摊经济大多持有中性的看法,对摆地摊逐渐丧失热情,大家逐渐回归理性。
其他文献
学位
学位
学位
多输入多输出(Multiple Input Multiple Output,MIMO)技术作为无线通信领域中的关键技术,与传统单输入单输出(Signal Input Signal Output,SISO)技术相比,能够在不增加带宽的情况下提高系统容量和可靠性。但是由于其发送端具有多根天线,也导致了MIMO系统存在信道间干扰(Inter Channel Interference,ICI)严重、接收端
学位
学位
学位
学位
学位
学位