基于大数据的网络舆情分析研究

来源 :浙江海洋大学 | 被引量 : 0次 | 上传用户:aszxc1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展赋予了个人充分表达自我意见和价值诉求的自由,也加速了网络舆情的发生和演变。民众越来越习惯于在网络平台上发表对于热点事件的看法,这使得网络舆情逐渐成为一种全新的社会力量和民意空间。网络突发性事件的此起彼伏使得社会各界越来越关注对网络舆情的发现、引导和治理工作。如何在大数据时代及时洞察网络舆情的变化,以防止舆情演化为舆论,化解潜在的公共关系危机成为管理者愈发关心的问题。与此同时,自然语言处理的方法也逐渐走向成熟,使得针对文本的情感分析技术发展和更新速度变得前所未有。随着用于加速并行训练的GPU算力的提升,深度学习再次成为人们关注的热门技术,循环神经网络、卷积神经网络及其各种改进模型被广泛应用于各种自然语言处理任务。本文将自然语言处理的技术应用于网络舆情分析这一社会问题的研究,内容主要包括以下三个方面:(1)以微博文本格式的内容为主要采集目标,构建大数据采集工具,使用Scrapy爬虫框架对文本采集任务进行管理和调度,利用Web Driver模拟访问新浪微博网页,使用Xpath提取网页中的博文内容,保存到Mongo DB数据库中,实现了对微博舆情文本的批量采集。(2)以Tensorflow为基础建立LSTM、GRU、DPCNN等深度学习模型,通过实验对比分析了各种模型的性能,并在此基础上提出一种基于模型融合方法的改进模型BGDA,以BERT预训练模型作为Embedding层对文本进行词嵌入,使用BiGRU结合Attention机制解决长程依赖问题,利用DPCNN提取文本的上下文信息,最后结合两部分的输出判断出文本的情感倾向。通过实验对模型进行了验证。(3)使用构建好的大数据采集工具对微博热点话题进行文本采集,对爬取到的数据进行清洗、分词处理,应用BGDA模型对网络舆情文本进行情感倾向分析。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
学位
学位