突发事件下微博舆情的话题发现和情绪分析研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:wenge228394
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着世界和我国的电子科技和互联网技术的快速进步和发展,以及现代智能手持通信设备的普及,新浪微博因其低门槛和自由的信息传播特点,已经变成了现代人们获取信息以及分享生活的一个平台,当用户想发表自己的看法或者观点时,可以通过微博来发表,他们也可以转发、关注和评论其他用户的微博。微博已经成为了突发事件舆情传播的重要工具和载体,在舆情传播中发挥着重要的作用。如何准确地发现那些在突发事件微博中引发的舆情观点和话题,并对其情绪进行分析,已经成为了社会专家学者们研究的重要热点问题。因此,在海量的微博数据中及时挖掘出微博舆情话题和掌握民众的情绪对于企业和政府在处理舆情的工作中有着重要的参考价值和指导意义。本文以突发事件的微博舆情为研究对象,以话题发现和细粒度的微博情绪分析作为研究内容。阅读了大量的相关文献,分析并总结了话题发现和情绪分析的研究现状,整理了相关资料,梳理了基础的理论知识,在此基础上,进行了对话题发现和细粒度微博情绪分析的深入研究,本文的主要研究工作内容如下:1.微博舆情的话题发现。由于微博文本语言简练、字符量较少,传统的LDA主题模型对于短文本的微博话题发现的效果欠佳,针对部分微博文本内容较短从而影响话题发现效果的问题,本文提出了一种短文本的扩充策略。在此基础上,提出一种基于LDA模型融合BC-BIRCH层次聚类算法的话题发现模型,该模型通过合并相同话题簇的方式来提高话题发现的效果。相较于单一的话题发现模型和聚类算法,本文提出的模型在话题发现效果上有一定的优势,适用于微博舆情的话题发现。2.微博的细粒度情绪分析。针对目前大多数情绪的分类模型仍然停留在平面型以及粗粒度的分类问题上,本文提出一种多层次的微博细粒度情绪分析模型,该模型融合了朴素贝叶斯和一种改进的随机梯度下降法。其中,针对粗粒度的微博情绪分类,本文采用的是朴素贝叶斯分类器,对细粒度的情绪分类则采用的是一种改进的随机梯度下降分类器,该模型的总体思想是先实现局部最优,从而达到总体最优。相较于平面型分类器而言,不仅大大减少了计算的复杂度,提高了分类效率,而且从分类的结果上来看,分类效果的提升也是十分明显的。本文采集了新浪微博的真实数据,对上述的工作方法进行了实验和验证,通过数据对比分析实验与本文提出的话题发现模型和细粒度情绪分析方法进行对比,实验结果表明本文所提模型和方法要优于其他算法。
其他文献
机器阅读理解作为自然语言处理领域的热门研究课题之一,意义在于使机器理解文本语义并具备推理、提炼文本信息并回答相关问题的能力。得益于不断发展的深度学习技术以及大规模机器阅读理解数据集的发布,大量优秀的模型不断被提出和改进,从而推动着机器阅读理解技术的发展和进步。然而现有的大部分机器阅读理解模型仍然具有以下问题:传统的词向量生成技术不能很好地捕获语义信息、效率较低;BiLSTM技术对文章和问题进行编码
为提高物流决策效率和品质,统计机器学习和数据定价分析作为新兴技术手段,能够为物流决策优化和有价值的数据共享过程带来新的视角和应用。例如,银行为冷链物流企业提供贷款业务前,购买关于冷链物流企业的数据来分析企业的经营能力,这一过程中需对交易的冷链检测信息数据进行定价。但因这类数据具有多样、数量繁多、价值不清晰等特点,通常冷链数据的价格难以有效确定。因此,本文针对冷链检测数据,提出基于Shapley值的
随着服务市场的迅速发展与国家相关政策的推动,物流领域中的物流服务供应链逐渐引起重视与发展,顺应了物流行业与企业发展的需求。物流服务供应链的主要参与成员有物流服务集成商、物流服务提供商与客户,服务集成商通过服务外包等形式让服务提供商为客户提供物流服务。但是由于物流服务供应链在我国发展较晚,受供应链间客户信息反馈的不足与合作产出意识薄弱等问题影响,物流服务供应链间各主体缺少合作激励,使物流服务供应链的
软件产品线是一种通过重用产品线中可复用成分来提高开发效率的方法,软件产品线开发过程,实质上是从软件产品线演化出新产品的过程。在软件产品线的演化方法中主要存在以下问题:(1)软件产品线的规模增大,导致特征数量增多,特征之间的约束关系也越复杂,软件产品线的演化需要判断演化出的产品对特征之间约束关系的满足性,人工管理方法已不能达到要求;(2)由人工从领域特征模型演化出满足多个目标的应用特征模型时,因为需
在移动互联网及电子商务快速发展背景下,O2O电子商务作为一种新的经济运行方式正不断扩大。O2O市场的快速发展使得越来越多的O2O电商企业将目光对准了供应链,欲通过对供应链的良好管理提高企业竞争力。在运营供应链的过程中,存在着多种风险因素,如供应链组织结构复杂多变、管理人员风险意识不足、以及技术手段日新月异等问题,O2O电商企业供应链的风险仍层出不穷。目前政府和企业对供应链风险问题管理主要聚焦在风险
公路隧道是公路交通基础设施的重要组成部分,裂缝是隧道中比较常见且危害较大的一种病害。及时有效地检测出隧道裂缝对隧道后期的养护与维护具有重要意义。基于数字图像处理的裂缝检测技术,克服了传统人工检测和仪器检测的缺点,为隧道的日常养护以及危害评级奠定了基础。此外,由于公路隧道裂缝与固有衬砌缝的形态相似,衬砌缝去除算法在裂缝检测领域有着广阔的应用前景,具有十分重要的理论意义和实用价值。本文深入研究如何去除
云计算任务调度策略直接影响整个云平台资源使用效率和云平台用户满意度,同时云计算任务调度属于完全NP问题,因此任务调度算法一直是云计算领域的研究难点和热点。目前,云计算任务调度算法主要分为传统算法和智能启发式算法。传统算法更偏向于单指标优化。智能启发式算法,从云平台角度出发对任务完成时间、任务完成成本等进行优化;从用户角度出发,提高用户服务质量;但是这些算法没有综合考虑用户服务质量和云平台负载情况。
数控机床被视为“工业航母”,是当代制造业的核心机械设备。数控机床的动力学特性与其结构的工作性能紧密相关。随着现代数控机床朝着高速、高精度和高可靠性的方向发展,高速铣削因其高生产率和灵活性而被越来越多的制造企业采用,有关机床动态性能的研究也越来越重要。目前数控机床动力学特性参数辨识方法主要有有限元分析法、试验模态分析法及运行模态分析法。但是,机床在加工状态下的动态特性与静态状态之间存在一定差异。利用
数字图像相关法(Digital Image Correlation,DIC)是一种用于全场变形测量的光测力学方法,因其具有操作简单、测量精度高、非接触式、全场测量等优点已然成为科研和工程的热门研究对象。二维DIC技术在测量精度、计算速度和适用性上都相当的成熟,但是在航空航天、精密加工、高端制造业等领域必须依靠三维DIC技术才能完成相关测量。然而现有三维DIC技术是通过对散斑点云的重构来实现变形测量
石墨烯由于其优异的力学、热学、电学、磁学和声学性能,使得其在高性能纳电子器件、复合材料、场发射材料、气体传感器、能量储存等领域获得广泛应用。因此,对石墨烯力学性质的全面掌握和深层次理解对石墨烯为代表的新型二维材料的发展与应用具有不可替代的作用。对于其性质的研究,使用分子动力学仿真计算方法需要占用大量的资源。基于Cauchy-Born准则的连续性介质力学方法,可以有效的降低计算时间,使得石墨烯能够更