论文部分内容阅读
随着移动互联网技术的快速发展,社交媒体平台在公众议题舆论生成和发酵演化的过程中的影响地位日渐突显。面对舆论环境的重大变化,无论是政府还是企业,对网络舆论的监控和引导的需求都愈发紧迫,并提出了更高要求。同时,随着网络媒体与传统媒体不断推进的深度融合、用户对于网络舆情环境的逐步适应和理性回归,以及政府机构对于网络舆情的深入认识和规范管理,使得意见领袖群体在经历了一系列发展过程之后得以自然淘汰和清理整顿;留存下来的往往具有更深厚的知识和经验积累、更专业的信息素养、更强烈的责任意识,因此在网络舆论中也具有更高的影响能力和媒体价值。是以,通过对意见领袖的舆情关注偏好和观点表达倾向展开研究,一方面有助于加强社交媒体中关键意见群体的管理,另一方面有助于完善网络舆论管理、疏导民意合理表达。然而,现有相关研究中,研究成果大量集中于意见领袖识别且实验主要在新浪微博中开展,主题分布的分析内容尚停留在基础表面,同时,持续性主题发现缺乏明确定义和量化方法。基于此,本文针对意见领袖主题分布和持续性主题发现展开研究。全文共分为七个章节,所包含内容如下。第一章,引言。基于本文研究背景、研究意义的阐明,随后对意见领袖、主题提取与分布、持续性主题发现、观点挖掘与漂移的国内外研究现状进行了全面的梳理和总结。进而明确本文研究思路,绘制本研究的技术路线图。基于此,详细介绍本文研究内容,归纳研究创新点。第二章,概念界定与理论基础。首先,界定了相关概念的具体表述,包括意见领袖、意见领袖主题、持续性主题和观点。其次,探讨了相关理论基础,对“把关人”理论和“议程设置”理论的基本描述定义、模式、特点、传播效果及其在网络环境中的表现变化进行了分析。最后,阐述了相关工具方法,对意见领袖识别和主题提取的主要方法进行分析。第三章,意见领袖识别及其主题提取。从识别流程、实验平台、舆情事件和识别指标四个方面构建意见领袖识别方法体系;继而围绕着新浪微博和知乎关于“江歌案”的讨论,进行了意见领袖识别实验,并从基础比较、角色定位和互动强度三个层面对识别结果展开分析。进而,从提取流程、数据获取与预处理、文本向量表示和文本主题挖掘四个方面明确了意见领袖主题提取方法,基于所识别出的新浪微博和知乎意见领袖为期三年的发文文本数据进行主题提取实验,并在筛选得到主题词的基础上,参考多个社交媒体和新闻网站内容,确定主题标签和分类。第四章,意见领袖主题的三维分布。首先,从时间、空间、人际三个维度阐释本文所提出的意见领袖主题分布分析框架,并对量化方法和判断标准进行了界定。其次,分别从整体、主题和意见领袖三个角度,对知乎、新浪微博个人和新浪微博机构意见领袖主题的历时分布展开分析。接着,分别从领域层面和主题层面,对这三组意见领袖分别代表的特定网络活动空间中主题的分布广度、集聚程度,以及不同空间两两之间的关联程度展开分析。最后,一方面,由意见领袖的主题耦合揭示意见领袖之间基于相同的讨论兴趣所建立的关系;以意见领袖为节点、主题耦合为边、主题耦合强度为权重构建关系网络,分析意见领袖的兴趣相关性。另一方面,由意见领袖的耦合关系揭示主题之间基于相同的讨论参与者所存在的隐性关系;以主题为节点、意见领袖耦合为边、意见领袖耦合强度为权重构建关系网络,分析主题的隐性关联。第五章,持续性主题和主题簇发现。首先,依据主题运行过程分析和主题相对讨论强度的计算方法,给出了本文对于持续性主题的明确定义。其次,基于主题相似性计算与过滤和主题簇提取条件,制定了主题簇发现方法。最后,结合实际数据,进行了持续性主题发现、主题相似性计算与过滤、主题簇的发现及持续性判断三项实验,提取出知乎和新浪微博中的持续性主题和主题簇。第六章,持续性主题中的观点漂移。首先,在将意见领袖的持续性主题发文中表现出随时间推移产生的观点变化进一步细分为:观点情感倾向和观点评价对象两个部分的基础上,分别阐释了观点情感倾向分析和观点评价对象分析的计算流程,对其表示形式和计算方法进行了设计,并界定其漂移检测的判断条件。其次,对持续性主题中观点情感倾向的整体分布和漂移变化进行分析,并比较知乎和新浪微博中表现的异同。最后,对持续性主题中观点评价对象的整体侧重和漂移变化进行分析,同样比较知乎和新浪微博中表现的异同。第七章,研究总结与展望。总结本文研究结论,并指出存在的不足和未来的研究方向。