论文部分内容阅读
教育是国计民生的基础。随着网络的快速发展,互联网已经变为聚集民意,表达诉求的新平台。因此,研究网络教育舆情情感,对于直观反映民众态度,深入了解教育现状等方面具有重要价值。数据可视化技术可以通过图形、图像将难以理解的抽象数据映射到符号、形状、颜色等可见形式,是在网络大数据时代强有力的数据分析方式。然而,当前社会存在大部分不具有教育领域知识与数据分析经验,但又有教育舆情分析需求的用户。因此,如何针对此类用户需求,设计有效的可视化形式,向其直观展示网络教育舆情情感的特征,并辅助其进行有效分析,是当前网络舆情情感研究面临的挑战。本文结合目标用户分析需求,提出了基于植物隐喻的可视化方案,并开发了两套针对不同用户需求的可视分析系统。所开发的系统可向用户直观展示网络教育舆情的情感特征,情感传播情况以及情感发展趋势等。本文首先提出了一种基于情感词典的情感识别方法,结合了程度副词、否定词表,并采用word2vec模型优化情感词典,提升了情感识别精度。此外,基于信息生态链模型的提出了网络教育舆情情感传播模型,用于定义情感传播及传播效率,并用于表达情感传播。其次,针对教育舆情情感分析需求,设计并实现了基于情感聚类的舆情可视化分析系统。首先,通过与不同类型用户的讨论,总结了其针对网络教育舆情情感分析的需求。然后,基于花园隐喻设计了情感聚类展示图,其能够从不同数据粒度展示舆情的情感倾向。同时,系统结合设计的情感传播图、矩阵散点图对比分析不同媒体平台的情感传播特征。最后,通过对网络教育舆情数据进行案例分析,证明其可用以辅助用户有效分析网络教育舆情特征,同时支持网络媒体平台的选择。进一步,针对用户分析教育舆情情感演变的需求,开发了基于时序演化的舆情可视化系统。其中,基于藤蔓隐喻设计了情感时序展示图,展示整体网络教育舆情情感随着时间的演化情况,并设计了基于网格的差异对比图,辅助藤蔓图分析情感传播的差异。同时,系统结合了时间轴图,多平台情感传播图展示单个舆情事件的情感发展状况,向用户展示了各个数据粒度下网络教育舆情情感的发展趋势。最后,通过对网络教育舆情数据进行案例分析,证明了两套系统的有效性与可用性。