基于STM的微博评论主题挖掘与情绪演变研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:yec
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字信息时代的数据价值越发凸显,各领域越来越重视数据所蕴含的信息。然而随着时代的发展,数据早已不再是简单的数值型数据,越来越多的非结构化文本数据逐渐涌入人们的视野,从商品评论到求职信息,亦或新闻通告,文本数据改变了传统数据分析的局面,仅利用人工阅读或者专家打分的分析形式已不再能满足研究者的需求,利用文本数据的分析技术研究非结构化数据已经成为一项重要的研究任务。如今,国内外计算机领域在文本数据分析方面已经取得了比较满意的成果,将其应用在其他领域的研究问题上已成为一种顺应时代发展的要求。目前应用较为广泛的有构建搜索热度指数、舆情情绪指数以及市场情绪指数等,但对已逝世、微博不再更新、社区留言却在不断刷屏的公众人物李文亮微博评论这类特殊舆论数据的研究不多。因此本文以此类评论数据为例,借鉴学术界较为成熟的主题挖掘算法,对微博评论进行分析。在数据预处理后,首先利用描述性统计分析方法对数据进行整体概览;其次利用传统的文本分类方法对评论数据进行情感分类,按阶段分析评论的情感极性与情绪分布;最后,对比三种主题模型:潜在迪利克雷分布(LDA)、词对主题模型(BTM)、结构主题模型(STM)对评论数据进行主题挖掘,揭示不同主题的分布,同时以情感分类数值结果作为二元协变量,并添加时间变量、主题内容协变量,构建线性模型分析主题流行度的演变趋势。研究结果表明:(1)评论数量在一年中除特定日期出现较大波动外,整体随时间逐渐下降后趋于平缓但一直延绵不断,体现数据的特殊性。留言内容上除“李医生”外,“晚安”、“致敬”等词汇出现频率较高,且二者分别位于普通日和特殊日的高频词榜首,结合高频共现词结果初步推断出评论区留言以祝福类与日常交往类居多。(2)对评论情感进行二分类时,积极评论的数量在各阶段始终高于消极评论。进行情绪多分类时,“好”、“乐”类情绪在各阶段占主流趋势,“哀”类情绪次之,一方面呈现出评论情感的积极性,另一方面为主题模型做数据准备。(3)对比LDA、BTM、STM的主题挖掘结果,发现LDA、BTM两种模型均存在一定局限性。相对而言,STM得到的结果较为优良,其不仅提供了所挖掘的主题词及与每个主题高度相关的评论原文,而且揭示了不同主题的概率分布及主题的情感倾向。结合人工阅读汇总便可将主题分为8大类,其中“交往-分享生活”和“交往-节日祝福”类评论在所有评论中占主要部分。STM的情感挖掘结果也展示出较为积极的一面,此外其还揭示了主题热度在一年中的演变情况,其中受时间显著影响的12个主题中,初期热度上涨的主题数量低于热度下降的主题数量。综合全文分析结果,本文一方面从统计分析方法与计算机技术运用的角度,另一方面从心理学的角度分析了公众人物背后的舆情发展走势,为未来类似舆情分析提供更多视角,有助于更加全面的关注社会舆情并为政府控制舆情和制定决策提供技术参考路径。
其他文献
<正>随着城市经济发展提速,传统楼宇经济模式也发生变革,打造面向未来的绿色、智能、现代化的智慧楼宇市场规模呼之欲出。未来十年,中国将打造世界上最大的智慧楼宇市场。据预测,到2025年,我国智能楼宇市场容量将高达20000亿元左右。1984年,美国联合科技集团在哈福特市将一座38层的旧智式金融大厦改造,对大楼的空调、电梯、照明、防盗等设备采用计算机进行监测控制,实现了自动化的综合管理,这也是行业公认
期刊
近年来,我国灾害事故频发,并呈现出多样性、复杂性的特点。应急救援车辆作为陆路救援的主力军发挥着重要作用。为了保证救援设备的安全以及避免对伤员二次伤害,车辆在行驶中,车身姿态需具备较高的稳定性。主动悬架系统可根据外部条件和车辆运行状态调节悬架参数,减小车辆的振动。因此,可通过控制主动悬架作动器的伸缩使车身姿态随路面变化调节,从而减小路面激励引起的车身颠簸与振动,提高车辆在地形复杂的救援区域的行驶平顺
学位
逆矩的研究可应用于风险评估、保险数学等诸多领域.在本文中,我们考虑了基于AANA序列的加权逆矩模型.在较弱条件下,我们得到了逆矩的渐近逼近及其收敛速度.作为逆矩的应用,我们研究了包含变点检验模型的随机比率模型,得到了随机比率的渐近矩逼近及其收敛速度.我们的逆矩模型和随机比率模型的条件比现有模型弱得多.为了验证我们的结果,本文进行了一些模拟和实例分析.我们的研究成果是对现有工作的改进和概括.本文的主
学位
值班律师制度是我国法律援助制度的重要组成部分,在我国法律援助事业中发挥着极其重要的作用。值班律师作为专业的法律帮助提供者,对于维护法律帮助需求方利益具有十分重要的意义。随着我国认罪认罚从宽制度的快速推进,值班律师制度也迎来了一定的发展际遇,相关法律法规围绕着值班律师的身份定位、权利范围、工作程序以及外在保障机制等方面做出了规定,为值班律师制度的发展奠定了立法基础。随着《中华人民共和国法律援助法》的
学位
中国是世界上人口数量最多、老龄化速度最快、老年人口规模最大的发展中国家,有着五千年的孝道传承和家庭同住传统。由于剧烈的社会变迁和快速的经济发展,中国家庭结构已经发生了巨大变化,而代际同住意味着家庭养老资源较为充足,因此家庭养老功能依然会是中国大多数老年人晚年生活的重要保障。同时,中国生育政策也在不断调整,从全面二孩政策的实施到三孩政策的出台,原来一直稳定的三口之家模式有了新的变化,子女数量的增多及
学位
供应链金融在中国快速发展,并逐渐渗透到建筑行业之中,各个大型央企、金融机构等平台都在加快布局,建筑行业供应链金融的发展具有极大的潜力。建筑行业之所以能够开展供应链金融业务,这与该行业近些年来数字化改革有着不可分割的联系,相对于传统的粗犷式发展,近些年来建筑信息模型技术快速发展,大型建筑企业加快搭建数字化平台,同时中小企业积极向大型企业靠拢,平台信息传播逐渐顺畅。针对建筑中小企业资金需求量大、融资渠
学位
随着物联网时代的到来,物联网设备及其基础服务使人们的生活更加便利。然而,近年来物联网安全问题频发,影响了物联网应用的服务质量,给人们的财产安全带来了威胁。异常检测技术可以通过分析物联网设备间的通信数据流来识别各种恶意攻击,以保护物联网安全。大量的物联网设备通信产生的数据具有生成速度快、数据量大以及数据分布时变等特点,这对物联网异常检测是巨大的考验。本文围绕无监督学习,研究物联网应用中通信数据流的异
学位
桐城桂林方氏因丁酉科场案和戴名世《南山集》案两次流贬东北,然而他们在艰苦的环境中能“不废吟咏”,留下了大量的诗歌以及方志作品,本文即以方氏一族在此期间的创作为研究对象,通过对他们诗歌的内容、艺术特色、所蕴含的诗学思想的探讨,以及对他们方志的内容、贡献的分析,进而把握他们创作的价值。本文分六部分。绪论:主要总结目前学界的相关研究成果,阐述选题的意义与价值,说明文章的研究方法与写作思路。第一章:考述桐
学位
目的:研究玻璃体切割术后患者失眠原因与护理策略。方法:选取2021年3月至2021年11月厦门科宏眼科医院收治的玻璃体切割术患者82例作为研究对象,按照随机数字表法分为观察组和对照组,每组41例。对照组玻璃体切割术患者给予常规护理干预,观察组给予针对性护理干预方法。采用疼痛NRS评分量表比较2组患者的疼痛感受,采用抑郁自评量表(SDS)、焦虑自评量表(SAS)比较2组患者干预前后抑郁、焦虑的变化,
期刊
在南渡这个特殊的时期,动荡不安的社会环境和颠沛流离的现实生活对士大夫的人生际遇、精神心态和生活方式都产生了很大的影响,词的题材重心和风格也在悄然发生转变。南渡词人在经历过靖康之难后,形成了向往山林和注重内心探索的倾向,词人们常常以幽约婉转的笔调通过对自然山水的描绘表露心迹,这也直接推动了这一时期山水词作的快速发展。本文以中华书局唐圭璋编《全宋词》和孔凡礼编《全宋词补辑》为底本,辅《樵歌》《石林词》
学位