【摘 要】
:
微博作为热门的社交媒体之一,具有及时性、便捷性、交互性以及用户使用体量巨大等特点。这些特性不仅使得监管的难度增加,也造成微博平台中充斥着虚假、消极、负面言论。因此,社交媒体舆情分析系统的研发显得尤为迫切。本文研究工作主要包括以下内容:1)社交媒体微博数据采集及预处理。本文以新浪微博中有关“7.5杭州女子失踪案”的数据作为研究对象,采用网络爬虫技术并按照不同策略获取数据,实现数据的采集。同时,对获取
论文部分内容阅读
微博作为热门的社交媒体之一,具有及时性、便捷性、交互性以及用户使用体量巨大等特点。这些特性不仅使得监管的难度增加,也造成微博平台中充斥着虚假、消极、负面言论。因此,社交媒体舆情分析系统的研发显得尤为迫切。本文研究工作主要包括以下内容:1)社交媒体微博数据采集及预处理。本文以新浪微博中有关“7.5杭州女子失踪案”的数据作为研究对象,采用网络爬虫技术并按照不同策略获取数据,实现数据的采集。同时,对获取数据进行预处理,使得分析的数据能够正常使用,为后期分析奠定基础。2)心理学研究表明拥有相同性格特质的人往往具有相似的情感表达方式。考虑到用户情感表达方式受性格因素影响,本文提出了融合性格的微博情感分析模型PBiLSTM(Personality Bi-directional Long Short-Term Memory)。该模型结合Big-Five性格模型,将微博文本的情感特征与用户性格线索进行融合,增加新的情感判别维度,并利用双向长短时记忆网络(BiLSTM)能够提取文本全局特征的优势,提高情感分类效果。实验结果表明,该模型的准确率可以达到96.63%,并在多项性能指标上取得了最优的结果。3)以新浪微博为数据来源,选取“7.5杭州女子失踪案”作为实例,搜集该舆情事件中参与主体的相关信息,运用社会网络分析法从多方面对舆情中的主要参与者及其相互关联进行了探究,同时揭示出该事件舆情的网络结构特征以及群体情感倾向。本文所提出的社交媒体舆情分析系统不仅可以了解微博用户对现实生活中热点事件的观点和态度、预判事件未来发展趋势,还能够使得政府及时掌握舆论发展方向、引导网络舆论向着积极正面的方向发展,具备较高的应用价值。
其他文献
王筠是清代“說文四大家”之一,他研治《說文》三十年,不泥古人,獨闢蹊徑,成就突出。王筠在《說文》方面著述繁多,以《說文釋例》最為著名,是其研治《說文》的精華之作。《說
随着功能需求的不断增加,安全关键系统的设计变得越来越复杂。如何通过建模与验证的方法保证安全关键系统的质量,一直以来都是形式化方法领域备受关注的问题。AADL作为一种应用广泛的建模语言,在安全关键系统的设计与实现中发挥着重要的作用。它提供了丰富的组件用来描述系统的体系结构,并且能够支持性能关键属性的早期预测和重复性分析。然而,AADL描述系统行为的方式主要是基于自动机理论,在建模和验证大型复杂系统时
在当前已经进入互联网时代的大背景下,随之出现了一种新的财产形式,即网络虚拟财产。近年来,关于网络虚拟财产的案件屡屡发生,特别是关于网络虚拟财产窃取类的犯罪案件在此类
面对飞速的经济增长与社会发展,5G移动通信系统提出了更高的性能要求,如更高的数据传输速率、更密集的无线连接等。传统的正交多址接入技术,如时分多址、频分多址、码分多址技术等,给不同用户分配不同的时频资源以避免相互干扰,新型非正交多址接入(NOMA,Non-Orthogonal Multiple Access)技术允许多个用户在相同的时频资源上进行通信。随着无线连接密度的急剧增长和频谱资源的有限性,N
给定某并发程序执行轨迹,基于约束求解的并发测试方法将并发错误模式和执行轨迹的可行性要求转化为一组约束条件,通过约束求解生成暴露并发错误的并发执行交织。该方法具有无误报、低漏报率等诸多优势。并发程序在开发过程中会经历多次修改,产生多个程序版本。在并发程序的演化过程中,直接对各个版本的基于约束求解的并发程序测试,由于未有效利用版本变化信息,而造成重复测试,致使并发程序回归测试面临效率较低等问题。为了提
徐青甫是民国时期江浙士绅代表之一,他多次担任浙江省政府要职,也曾代理主持浙政。他的经济学著作丰富,其经济学思想主要体现在《经济革命救国论》、《物价问题之研究》和《
随着通信技术和半导体技术的发展,信息的传递越来越便捷,现代通信使人与人之间的联系十分紧密,万物互联互通成为了“物联网”的发展目标。窄带物联网是一种发展迅速的物联网协议,可以在LTE网络上升级和部署,对射频收发机和频率合成器提出了更高的要求。在先进工艺条件下,宽带全数字锁相环更适合于物联网应用场景。数控振荡器作为全数字锁相环频率合成器的核心模块,对整个系统的性能具有重要影响。因此宽带高精度数控振荡器
作为人工智能的核心算法之一,神经网络对训练速度、准确度、架构复用性的要求越来越高。目前训练一个中型规模的多层神经网络需要亿量级计算量。传统架构并行度低、复用性差、扩展能力弱等局限性已经不能满足神经网络在并行计算中的需求。因此,本文对基于流式分布式架构的神经网络进行研究,以满足训练速度提升、架构复用和计算能力扩展的需求。本文首先提出了一种基于Storm流式分布式架构的神经网络训练模型NN-S(Neu
改革开放以来,我国制造业发展迅速,建立起了完整的产业布局体系,推动了城市现代化发展和区域经济空间优化布局,尤其是在重塑城市经济空间结构方面。伴随着劳动力、资源利用和
随着无线通信技术的不断发展、智能终端的不断普及和室内基于位置服务(Location Based Service,LBS)的业务需求的不断增长,近年来室内无线定位技术受到越来越广泛的研究。基于无线局域网(Wireless Local Area Network,WLAN)的室内定位技术得益于成本低、覆盖范围广、便携性等优势成为了室内无线定位的研究热点。本文研究了不同的室内定位技术和室内定位系统,分析了