社交网络中热点事件的多标签公众情绪分析

来源 :东南大学 | 被引量 : 0次 | 上传用户:syy1116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们通过移动设备在社交网络上传播实时信息,进而成为热点话题的发起者与传播者。热点事件在社交网络中传播与扩散,产生热点事件相关的舆情,进而影响我们的现实生活,所以对社交网络中舆情进行分析有着重要意义。公众情绪信息是舆情的重要组成部分,当前的舆情分析多是站在话题演化的角度,忽略了舆情中“情绪”的信息,本文将从“情绪”的角度出发,针对用户发布的关于热点事件的文本内容,通过文本情感多标签分类的方式,细粒度展示社交网络中热点事件下公众情绪在不同时间段的发展变化过程,对现有舆情分析内容的全面性和完整性进行补充。本文具体工作如下:(1)考虑到使用seq2seq模型处理多标签任务时,标签序列未知的问题,本文提出一种基于条件概率的动态标签排序算法。该算法能够结合模型预测结果集合和样本真实标签集合动态调整标签序列,提升模型效果。在序列生成模型SGM的基础上,设计融合该算法的ASGM模型。通过对比模型在RCV1数据集上的训练效果,验证算法的有效性。(2)对于神经网络多标签模型如ASGM,因参数量巨大和梯度消失等导致的模型难以训练的问题,设计了基于Highway Network的多标签分类模型TML-HN,有效减少了参数量,缓解了梯度消失问题。最后在RCV1数据集上通过与其他模型和算法的对比验证TML-HN模型的有效性。(3)设计热点事件公众情绪分析算法,在验证上述两种模型有效性的基础上,通过多标签情感数据集训练上述两种模型,获取抓取的社交网络热点话题数据的情感标签,通过不同的时间粒度,通过统计展示公众情绪随时间发展变化的过程。设计并实现集成爬虫、文本情感多标签预测和热点事件公众情绪分析三部分功能的多标签公众情绪分析原型系统。
其他文献
随着经济全球化的日益深入,国际性招标活动也日趋频繁。招标文件是整个招标活动的基础和重点内容,而招标文件的翻译质量在很大程度上决定着项目招标能否成功进行。因此,对招标文件的翻译过程进行总结,能够为本领域的翻译实践提供借鉴和参考。在上海唐能翻译公司实习期间,笔者负责某公司《招标书》的英汉翻译。该翻译任务在充分结合源文特点,并以平行文本为参照的基础上完成。本报告选取其中10000字译文,就翻译中出现的重
技术文本的翻译可以促进技术文档的标准化,为科技产品的开发和推广提供支持。该类型文本的翻译实用性强,对于翻译方法和技巧的探讨也有借鉴作用。本报告分析了笔者在翻译目的论指导下进行的IP摄像机片上系统规格书英译汉实践,旨在讨论笔者在翻译过程中遇到的问题,并探讨相应的解决方案,以期为今后同类文本的翻译提供一些参考。本报告共分为五章:第一章简要介绍了此次翻译实践的背景;第二章介绍了翻译目的论以及国内外对英语
Android是目前全球最受欢迎的移动操作系统。有越来越多的攻击者为了获取非法利益,将Android应用重新打包后发布到应用市场,给用户的隐私和安全带来了巨大威胁。因此在过去一段时间里有很多的学者都致力于研究Android重打包应用的检测。但过去大多数研究都集中在代码相似性检测上,这些算法无法检测混淆或加密后的应用。最近提出的基于UI特征的重打包检测算法具有抗加固性。一些基于动态获取UI特征的检测
随着无线通信技术的发展,无线网络的安全性越发受到人们的关注,尤其是对接入设备的身份认证是保障通信系统安全的重要组成部分,传统的基于加解密算法和安全协议算法的无线通信安全体系都是建立在数据链路层及其以上的层级,人们开始关注从更底层的角度——物理层考虑身份认证,因此通信设备的物理层特性其唯一性以及难以伪造的特点对于无线通信的认证安全具有着重大意义,值得去深入研究。本文的研究对象是GSM移动设备发送的G
随着云计算技术的不断发展与广泛应用,虚拟化技术也变得愈加重要。相比于传统虚拟化技术,基于容器的虚拟化技术更加轻量、灵活,对系统性能造成的影响也更小,因此受到越来越多用户和厂商的青睐。Docker技术是容器技术的一种,目前在容器市场中占据着主导地位,已成为容器技术的事实标准,因此Docker平台的安全防护具有重要的研究意义和实用价值。在Docker平台中,容器的低隔离性及镜像的构建和分发都可能引入新
现今社会生活对网络的依赖程度持续加深,在有意无意间,个人数据都在被服务平台收集并使用,这固然带来了极大的便利,但同时这些用户数据中包含着大量敏感的隐私信息,一旦泄露必将面临遭到非法使用的严重后果,因此保护数据安全和维护用户隐私是当今一项重要的研究议题。最初对数据安全的研究主要集中在匿名化公开内容、去除其中敏感信息上,而后随着对隐私理解的加深,一些研究者将目光转向了对用户检索公开信息过程中的检索目标
随着物联网技术的发展,在物联网系统中的视频流量将会呈指数增长趋势。视频中包含的人脸信息,也会随之大大增加。利用边缘设备识别视频中的人脸信息,逐渐成为科技界的发展趋势。由于边缘设备的资源有限,如何在资源受限的设备中完成人脸检测与识别,是一个具有重要理论意义与工程应用价值的研究方向。针对视频的相邻帧中存在冗余信息的问题,本文提出了一种基于d Hash算法与图像分块技术结合的双阈值关键帧提取算法。该算法
近年来,随着移动网络和传感器网络的大规模应用,无线通信有了飞速的发展,安全的无线通信也受到了广泛的关注。传统的保证通信机密性的方案,如利用密钥协商算法进行密钥分发,其安全性由计算复杂度决定,在实际无线网络环境中的应用往往会受到终端能力的限制。基于无线信道特征的密钥生成方案源于香农对完美保密通信理论的追求,利用了无线信道的不可预测性、随机性和地理空间位置唯一性,通过实时生成的对称随机密钥实现了无线通
效率是企业的生命,也是企业的竞争力之所在,为实现健康长远的发展,企业必须努力提高自身的经营效率。从现有研究来看,影响企业经营效率的因素是多方面的。但学者们主要从公司治理水平、公司财务特征以及技术创新等方面进行探讨,而对于企业所处的外部制度环境,特别是地区腐败这一重要外部因素在企业经营效率中的作用并没有给予足够的重视。改革开放以来,我国经济持续较快增长,但也存在着比较严重的腐败问题。腐败作为制度环境
网络流特征分布会随着网络环境的变化而动态变化,产生概念漂移问题,造成基于流特征的机器学习网络流分类模型准确率下降。依据固定周期更新分类模型不但耗时且浪费大量资源,因此及时准确地检测到概念漂移从而更新分类模型至关重要。当前主要通过分类准确率下降来检测概念漂移,然而统计分类准确率需要标记样本,花费许多时间和资源。检测到概念漂移时,若仅在检测到的漂移样本上重新训练分类模型会遗失之前的知识;若把所有时期的