基于复合网的微博用户行为特征研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:yzymd_223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博用户网络是一个涉及普通用户、名人等多类用户要素以及其间关注、推文、转发、评论等多种行为关系的复杂网络,以往对微博用户网络的研究通常仅对一种关系进行讨论,忽略了微博用户的行为间存在的相关性,而事实上微博用户的行为是存在着关联关系的,分析并发现微博用户多种行为间的关联关系,对揭示微博用户的网络行为规律,理解微博用户行为的复杂机制,具有重要的现实意义。基于此,本文使用KDD CUP2012任务1提供的腾讯微博数据,提取了用户的关注关系,以及推文、转发与评论中相同关键词关系,基于复合网模型,构建了用户关注关系子网与关键词子网;基于该模型的子网加载运算,构建了用户关注与关键词复合网;通过对子网以及复合网若干拓扑性质的分析,发现了一些有趣的现象,为理解微博用户的复杂行为提供了支持。本文的主要工作阐述如下:(1)微博用户关注子网和关键词子网的构建及性质分析。将用户抽象为结点,用户间的关注关系抽象为连边,构建了关注子网;关注子网的度分布近似幂律分布,度大的为名人,也即名人受关注数大;将用户抽象为结点,用户间有≥k(k∈N+)个相同关键词的关系抽象为连边,构建了多个关键词子网;多个关键词子网的度分布也均近似服从幂律分布,但普通用户的度远大于名人的度,说明普通用户参与的话题较多,而名人的话题较专一,这可能与名人专业领域有关。(2)构建了用户关注与关键词复合网,分析了复合网边界结点的性质,发现随着边界结点在关键词子网的度的增大,关注子网的度微弱变大,说明关键词相似度子网和关注子网呈现微弱的正相关性,说明用户拥有的话题越多,被关注的可能性越大。(3)为发现用户类型对边界结点性质的影响,抽取了名人及其间的关注关系、关键词关系数据,构建了名人间关注和关键词复合网,分析了边界结点的性质,发现随着名人关键词相似度子网度逐渐增大,名人关注子网的度有微弱减小的趋势,即名人关键词相似度子网的度与名人关注子网的度呈现负相关关系,这与普通用户的规律恰好相反,说明名人更愿意关注在某一领域比较专注、权威的名人。
其他文献
随着Internet与Web技术的高速发展及广泛应用,如何从众多的服务功能相近或相同但QoS属性值不同的Web服务中选择出最能满足用户需求的Web服务,已经成为相关领域的一个研究热点
超声诊断设备已经成为现代医学四大影像设备之一,由于具有无损伤、无痛苦、操作简单、方便等诸多优点,在临床诊断中得到了广泛的应用。数字化超声成像技术相比传统超声成像技术
PC机、手机、平板及智能家电等电子设备的不断普及促进了三网融合下各种新兴业务的快速开展,然而这些新兴业务的身份认证系统之间由于服务动态性、异构性及开放性的不同,导致各
随着各式各样的医学仪器不断涌现,临床诊断中出现了越来越多的医学图像。由于医学图像种类繁多,且人体结构复杂,人工提取医学图像的特征比较困难,自适应能力差,分类效果有待
数字签名是对传统手写签名的电子模拟,是随着公钥密码体制的建立而产生的一个新的密码学应用方向,和传统手写签名一样,数字签名是一种认证机制,保证了消息的来源和完整性,所
医学诊断领域,超声成像诊断设备因为其经济实用、无侵袭、无损伤、对人体影响小、低成本、适应性广等优势,在临床诊疗中得到了广泛应用。随着计算机在生活中的普及与软硬件资源
无线自组织(Ad hoc)网络是一种无需基础设施且具有自组织能力的分布式临时自治网络系统。无线Ad hoc网络的易部署、终端可移动、灵活便捷以及可扩展等特性使之具有广阔的应用
本文首先分析配电自动化系统和配变终端国内外研究现状,针对国内现有配变终端存在问题,在对配变终端及相关国家标准充分调研基础上,确定配变终端基本功能及技术指标,借鉴当前国内
更快速地渲染出更具有真实感的人脸,对于虚拟现实,影视娱乐,医学仿真,信息安全等领域都有着重要的意义。因此,实时真实感人脸的渲染技术在应用领域中拥有广阔的前景,其也一直
随着网络社交平台的崛起,海量主观性信息迅速涌现。鉴于这些主观数据往往具有巨大的潜在价值,情感分类、观点挖掘等领域逐渐引起了广泛的关注。然而传统的情感分类具有领域特