社交网络信息传播建模与节点影响力研究

来源 :东华大学 | 被引量 : 5次 | 上传用户:shuiwadandan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类正迈入信息化时代,信息正成为重要的社会财富。随着微博等社交网络的飞速发展,其在网络舆情监控以及广告投放效果评估领域应用得越来越广泛。越来越多的学者开始关注和研究微博网络,微博网络中的信息传播机制研究和影响力评估逐渐成为研究中的热点。本文选取社交网络中使用最为广泛的新浪微博为研究对象,首先利用网络爬虫抓取原始数据,并从中提取出影响用户转发行为因素和用户节点影响力评估指标相关的数据,得到期望数据集;接着在抓取到的数据基础上建立微博消息传播模型——基于转发行为概率预测的加权有向拓扑模型;最后在建立微博消息传播模型的基础上,基于改进Page Rank算法对微博网络中的用户节点进行影响力评估研究。数据的抓取是整个研究的基础。在比较各种网页数据抓取方式的特点之后,选取能够很方便的按照自定义需求进行数据抓取的基于网页爬虫的抓取方式。在抓取到指定规模的原始数据后,根据需要将数据分为微博用户属性和微博内容属性。其中微博用户属性包括用户ID、关注数、粉丝数、微博数量以及是否为认证用户等;微博内容属性包括创建时间、是否包含特殊符号、转发数、评论数等。最后还对数据抓取过程中的关键问题特别是反爬策略等问题进行了分析和解决。在抓取到的数据集的基础上,对微博信息传播机制和传播规律进行研究,并建立基于转发行为预测的微博消息传播模型。针对当前社交网络信息传播的研究侧重于从微观层面出发,对单个用户的转发行为进行分析,而少有从拓扑层面对整个社交网络中的信息传播过程建模的研究。本文首先确定了影响转发行为的特征因素——主要是微博内容与用户兴趣、微博用户的社会关系、微博文本与用户属性以及受激活次数这四个方面。在对这四大类特征因素进行分析的基础上,利用逻辑斯蒂回归模型二分类得到节点间的信息转发概率,进而建立基于转发预测的加权有向拓扑信息传播模型,给出模型的生长演化过程,并在采集到数据集上进行验证实验。实验结果证明所构建的模型能够很好的反映微博网络的网络结构,能够较好的模拟微博网络中的信息传播过程。在构建微博消息传播模型的基础上,本文还对微博网络中用户节点的影响力评估进行了研究,改进网页重要性评估算法Page Rank以适应微博网络的特点,特别是针对算法中投票阶段和缩放机制存在的问题进行了改进。现有的影响力评估研究,一般只简单地考虑微博的转发数和评论数这两个指标的影响,但微博作为新兴的社交媒体,仅考虑微博转发数和评论数已经不能准确的评估消息影响力,因此我们需要对微博网络中消息的传播进行进一步分析,提取更多的特征因素以更好的评估用户节点的影响力。在确定影响力大小衡量指标——主要是信息传播度、传播活跃程度以及传播受众广度后,对Page Rank算法进行改进,主要是针对其投票阶段的平均分配权值的方式忽略了个体重要性差异进行改进,并确定按传播活跃程度和传播度的数值化乘积作为分配PR值的权值,以达到让传播能力强的节点获得更多的投票的目的。最后在数据集上的实验结果表明改进后的算法比原始Page Rank具有更好的命中比例。
其他文献
二战期间,美国为克服军营的枯燥冷寂,提高士兵士气,向军队提供了1.2亿本“军供版”图书。为方便战地生活,还特别制作成小巧、轻便的开本。战争打赢了,这些图书功劳不小。一个
将灰绿黄堇(Corydalis adunca Maxim.)无菌试管苗的茎段接种于附加不同BA 和NAA浓度组合的MS培养基上,诱导出愈伤组织.实验表明较高浓度的BA和较低浓度的NAA组合有利于灰绿黄
近日,中共中央印发了《中国共产党重大事项请示报告条例》,《条例》对全面规范和加强请示报告工作作出明确规定,为开展请示报告工作提供了基本遵循。《条例》的出台有利于提
血管内皮生长因子(vascularendothelialgrowthfactor,VEGF)是一种特异性的与血管生长有关的生长因子。不论是在胚胎发育、创伤修复的生理情况下,还是在炎症、增殖性糖尿病性视网膜病变、肿瘤生长、视网膜中央静脉阻塞
目的探讨盐酸坦洛新缓释胶囊治疗Ⅲ型前列腺炎的临床疗效。方法 120例Ⅲ型前列腺炎患者随机分成两组,治疗组和对照组,每组60人,治疗组采用盐酸坦洛新缓释胶囊0.2mg 2/d口服,
目的探讨白内障并青光眼的有效治疗和护理措施,总结护理经验。方法对我科2009年1月~2010年12月30例三联手术患者的围手期术护理分析。结果 30例顺利完成手术,术后无1例并发症
目的探讨手术室护理实习生临床存在的问题及对策。方法根据实习大纲的要求,我院手术室采用总体授课与一对一带教相结合的方法,对护生进行技能点强化训练。结果通过有针对问题
美国寿险市场高度发达,在国民经济生活中发挥着重要作用。本文基于保险监管视角,对美国寿险业的发展特征和美国保险监管制度进行分析研究。对美国寿险业发展特征的研究发现:
对早期AMD眼和对照组眼进行了P-VEP测定。结果显示,早期AMD组与对照组之有间显著性差异,表现为P100潜伏期延长和P100波幅值降低,异常检出率分别为37.8%和43.5%,说明在早期AMD眼中,尽管视力正常,但已有视功能变化,P-VEP的检
目的探讨健康教育对中年男性冠心病患者的影响。方法对42例为冠心病的中年男性患者进行健康宣教,出院后跟踪随访。结果教育后患者的生活方式、知识熟悉程度均有明显的提高,与