社交媒体中的用户情感极性分析方法研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:kevin7878
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着以互联网为基础的社交媒体的迅猛发展,作为真实世界反映与延伸的社交网络已经成为了人们日常生活中密不可分的一部分。人作为社交网络的主体,积极参与到以互联网为基础的社交活动中,并在其中主导着整个社交网络的交互行为,直接影响着社交网络环境。社交媒体不仅包含了人际交互行为信息,也包含了用户发布的结构化或非结构化信息,这些海量的、不规则的、带噪的、隐性的社交媒体信息给社交网络用户分析带来严峻挑战。意见领袖挖掘以及用户情感极性分类作为社交网络用户分析领域最具代表性的话题,一直是研究学者重要的研究内容,他们在诸如市场细分、市场营销、舆情分析、用户推荐等诸多领域应用广泛。然而针对传统的中心性度量难于适用社交网络以及用户发布的文本内容的复杂性、带噪性、无规则性带来的分类不准确性等问题,本文提出了一种意见领袖挖掘算法以及一种事件情感极性评估算法并将其运用到基于社交行为的用户情感极性分类算法中起到较好效果。论文的主要工作如下:1、提出了一种意见领袖挖掘算法,它借鉴了PageRank算法的核心思想,将其引入到社交网络用户影响力分析之中,算法不仅考虑了社交网络用户关系拓扑结构信息,而且融合了社交网络用户的一些体现其影响力的属性信息。在社交网络拓扑信息方面算法基于事件中用户的转发关系构建了一个加权的用户关系网络,事件是具有主题性质的和大量广泛的用户参与的,以事件为基础使用转发机制构建关系网络不仅具有信息的针对性与目标性,而且明显能减少社交媒体信息数据量的使用,同时这种网络因事件的不同具有动态性。针对社交网络用户属性信息方面,算法使用了能直接体现用户影响力用户属性信息。2、研究了一种基于事件中用户社交行为的用户情感极性分类算法,借鉴文本情感极性度量思想,提出了一种基于情感词典和词频统计相融合的事件情感极性评估算法。该算法不仅在基础情感词典正情感词和负情感词上,引入连词、程度副词、表情符以及停用词,而且针对情感词典无法识别的推文进行词频统计分析,词频的学习以及权重的计算依据已经被识别的情感推文而得,最后加权计算事件的情感极性。其次融合意见领袖挖掘和事件的情感极性建模用户情感极性分类为一个凸优化问题,预设用户针对主题事件的态度值,计算意见领袖态度值和参与事件讨论并具有转发行为的普通用户的态度值,根据态度值的正负完成用户分类。算法省去了大量的用户属性特征、社交网络拓扑信息、交互信息的使用与分析,并且相对于使用用户文本内容的用户分类,该算法准确率有明显提升。
其他文献
期刊
电能作为现代文明的标志之一,在工业生产和日常生活中均发挥着不可替代的作用。随着我国电气化技术的发展,电网中投入大量的敏感型设备和非线性负载,这在一定程度上增加了电力系
非高斯信号处理与非平稳信号处理都是当今信号处理界的研究热点。严格地说,实际上许多信号是非平稳随机信号,但是由于理论条件的限制,人们对于信号进行分析仅仅局限于平稳情况,直
下一代网络是基于分组的多业务网络,具有不同业务特征和区分服务质量需求的多业务共享同一承载链路,网络需要为不同业务提供区分的性能保证。多业务的区分管理和控制可分别在业
由于近年来统一通信的快速发展,对于SIP协议的研究也成为了当前研究的热点。SIP协议作为统一通信会话控制中的主要协议,因其特有的简单性和灵活性已经被越来越多的厂商和组织所
期刊
针对在当前互联网络中如何提供有服务质量保证的业务这一问题目前主要有两种解决方案:网络通信和应用服务。网络通信的解决方案通过对网络基础设施的改造来满足业务的这种需求
互联网的飞速发展使网络安全问题变得越来越重要,国家863计划"网上信息安全综合分析与监控系统"着眼于通过技术手段和政府监管相结合,制定一套符合我国国情并与国际接轨的国
期刊
2006年,ITU-T提出新一代语音编解码标准G.729.1。其码流速率可根据网络的实际状况有效利用带宽,进行自适应调整。随着相关技术的发展,G.729.1宽带语音压缩标准必将有着广阔的