论文部分内容阅读
随着Web2.0时代的飞速发展,网络空间越来越成为用户开放、自由的公共舆论场,与现实世界相比,网络世界也具有隐秘性、多样性、无权威性、扁平性等特质,网络用户可以在各种社交媒体畅所欲言,表达个人意见和对社会生活的见解,诸如微博、朋友圈、论坛、贴吧、电商评价网站等已成为用户传播海量信息的平台,其中包含着丰富的公众评论意见和情感信息,在一定程度上可形成社会舆论,影响着突发事件或者社会公共事件等的发展和走向。因此对用户情感的判断不仅可以反映出公众的情绪走向,便于网络舆情态势监测,实现社会稳定,更可以在各种微领域具有重要价值,如在线产品评论分析评价好坏、股票市场情绪分析进行风险控制,电影风评分析预测票房收入等。然而互联网内容传播过程中也显现出现实世界中的巴尔干化现象,即网络用户个体逐渐演化为具有相同利益或者情感倾向的群体。传统情感分析方法在文本特征提取上已取得一定成果,忽略了用户本身的社交关系,假定数据样本都是符合独立同分布假设的,只分析单个用户的情感。但是,用户之间必然普遍存在着关联,用户社交群体的整体情感倾向性会比单个用户更加明显和稳定,因此,以基于社交网络分析的方式对用户群情感研究有重要的意义。本文展开的研究工作包含以下几个方面:第一,社交网络关联挖掘。本文从相似用户节点会有相似的群体倾向的角度出发,提出了一种基于FRAP的网络社区划分方法。本方法首先在向量空间层面刻画出用户节点的位置信息,定义了能量函数嵌入力引导空间,通过不断降低能量大小得到收敛位置向量,并利用多级邻居信息融合为节点差异度矩阵;然后经差异度的置信值传递聚类得到核心节点,聚类后通过标签优化转移的方式实现模块值的局部收敛,最终借由衡量系数的标签聚合更新节点的类标签,通过归属值指导生成的历史标签序列得到社区划分结果。实验证明了FRAP方法得到的社区划分在测试集上有更好的表现效果。第二,面向用户群的情感倾向分析。从用户群的角度对情感进行多粒度的评判,首先提出基于单用户情感偏好的研究假设,并通过建立情感强度和扩散热度的一级指标验证关于用户情感的子假设,针对评论数据中喜悦等正向情感的显著偏向性以及情感扩散等规律展开分析;其次给出了面向用户群的情感倾向分析方法,通过社区划分的方法确立了联系紧密的用户群体,从历时和共时的角度对用户群的情感趋势变化进行分析,并基于用户群的规模、密度、分布等相关属性给出情感差异性的探讨并进行实验对比。