社交媒体中基于上下文感知的用户情感分析

来源 :东南大学 | 被引量 : 0次 | 上传用户:lg97060329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,社交媒体已经成为人们交流信息、表达自身观点情感的重要途径,而随着移动互联网的发展和智能手机的普及,用户在社交媒体中发布的推文通常包含多种模态数据(例如同时包含文本和图片),在多模态数据中,每个模态都为其他的模态提供了信息补充,即模态之间存在关联性。然而,传统的情感分析主要基于单模态数据进行(例如只考虑文本或只考虑图片),少数的多模态情感分析研究则关注不同模态的融合,却忽略了上下文信息的影响。但用户发布的推文通常长度较短且缺乏明显的情感词,而上下文信息可以对推文的环境特征进行描述,能够有效补充推文信息,对于提高用户情感分析的效果具有重要的作用。针对已有研究的不足,本文从社交媒体中推文发布者的角度出发,考虑推文中不同模态数据在情感语义上的关联性以及推文的上下文信息对于用户情感分析的辅助作用,提出基于上下文的用户情感分析模型,以推测用户在发布推文时的情感分布。论文的具体工作包括:首先,本文从真实社交媒体数据出发,设计合理的策略过滤并选取有效的数据集,并对数据集的缺失信息进行补充抓取。在此基础上,针对推文文本,为了解决其规范性较差的问题,对用户推文中的文本内容进行预处理操作。而针对推文图片,从心理学角度出发,提取推文图片中与情感因素相关的底层视觉特征,并利用视觉词袋模型将图片底层视觉特征量化为视觉词项。其次,提出基于上下文的用户情感分析主题模型。该模型将情感信息看作是蕴含在推文中的隐含变量,通过约束推文的整体情感分布和主题,建立不同模态数据之间的情感语义关联,并从推文时间邻域信息、评论信息这两类上下文出发,显式建模两者与用户当前情感的相关性。在此基础上,对模型中的变量采样规则和参数更新规则进行推导,进而提出用户情感分析模型参数估计的采样算法。最后,为验证本文提出的模型与算法的效果,本文在真实的社交媒体数据集上对本文提出的模型进行实验验证,通过对实验结果的对比与分析,可以得出以下结论:本文提出的基于上下文的用户情感分析模型能够更有效地分析多模态推文情感,所利用的两种上下文信息对于推文情感分析的正确率等评价指标的提升发挥了重要作用,从而证明了本文提出的模型算法的合理性和有效性。社交媒体用户情感分析的研究是理解用户个体行为的关键,也是揭示用户行为规律的基础,其研究具有重要的现实应用价值,能够为网络口碑营销、心理健康医疗、股票市场分析等诸多领域提供可靠的理论依据。
其他文献
水资源问题已经成为制约西安市浐灞河流域经济社会发展的瓶颈。本文结合西安市浐灞河流域经济、社会、生态环境等现状,就面向生态的流域水资源优化配置进行研究,建立了多目标
文章基于“可持续发展”思潮的背景和在其影响下的当代设计思想,将“设计”看作一种方法或力量,思考其如何对社会、对未来产生影响,并从社会性和文化性的角度探索“设计”与
利用遥感技术及时准确地监测黄河凌情,对于确保黄河防凌安全具有重要意义。在分析当前黄河凌情遥感监测存在问题的基础上,提出建设黄河凌情遥感监测系统,全面提升黄河凌情遥
耕地资源作为宝贵的自然资源,是人类得以生存和发展的重要保证和物质基础。目前,福建省正在大力推进海峡西岸经济区的建设,城市化和工业化的水平正在不断提高,经济社会快速发
黄土高原丘陵沟壑区生态环境脆弱,水土流失严重,实现农业可持续发展面临着巨大的挑战,寻找水土资源的高效利用模式是实现可持续发展和资源节约环境友好型社会的要求。本文在
随着计算机和网络技术的不断深入发展,如今的互联网已经迈进了社交媒体(social media)时代。用户既可以在社交媒体上对新闻时事、社会现实、消费产品等话题发表客观或主观的
目的研究"中医慢病临床科研体系及其成果转化应用模式研究"项目在数据管理方面的科学性、合理性,为本项目的后续工作改进提供参考。方法依据国内外有关临床研究数据管理工作
汉语的规范化工作与对外汉语教学工作的关系至为密切。中国国家语言文字工作委员会的工作范围和当前正在进行的许多管理与研究工作跟对外汉语教学界有着许多相通点,双方应该在
会议
目的:探究含sushi重复蛋白X连锁2蛋白(sushi repeat-containing protein X-linked 2,SRPX2)是否可通过巨噬细胞对血管生成产生影响及其可能的机制。方法:用shRNA-SRPX2及shRN
从科技档案管理的角度出发,以科技档案管理系统建设的总体思路为架构,利用文献分析法,结合在水利设计单位从事科技档案管理系统建设时所遇到的问题和解决方法,从系统应用层面