社交网络用户影响力评估算法研究与分布式实现

来源 :江苏大学 | 被引量 : 1次 | 上传用户:asicsyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以微博为代表的新型社交网络不同于传统网络,其信息传播和扩散主要依赖于海量用户之间的关系。如何使信息被更多的用户所接收,即用户影响力最大化问题,已经成为社交网络平台及其应用的研究热点。但是由于用户数据量巨大,传统集中式数据处理方式在海量数据集处理方面的高成本、低效率的限制,使得目前对于用户影响力的研究成果并不突出,平台上海量数据资源也没有得到充分利用。PageRank算法是由Google开发的用于评估页面等级的算法,该算法以页面的链出和链入情况来对页面等级进行评估。论文将社交网络用户之间的相互关注关系抽象为页面之间的链出和链入关系,将PageRank算法应用于用户影响力的分析研究中,并将用户追随者的质量,即追随者的影响力的情况也作为重要的参考因素。并以此,设计了一种改进的用户影响力评估算法——URank算法。论文给出了URank算法的设计思路和详细实现过程。粒子群PSO优化算法是一种群体智能算法,以其收敛快、易实现等优点受到学术界广泛的重视。由于用户影响力分析也是一种优化设计,因此论文提出一种基于PSO算法的用户影响力评估算法——PsoRank算法。算法综合考虑用户自身因素和其追随者质量对用户影响力的影响,扩展了常见的用户影响力评估算法所依赖的参考因素。该算法在对用户影响力进行评估时,以用户自身质量,即用户的粉丝数、发布信息的频率和信息被转发率/被评论以及用户是否认证等因素为基础,以用户追随者的质量为条件,并且将用户影响力增量因子作为算法的适应度函数来判断是否对用户的影响力进行更新。从多方面保证算法评估出的用户影响力的合理性和公正性。为了使提出的算法能够适应海量数据处理,论文提出将URank和PsoRank算法按照MapReduce分布式并行化编程模型将论文设计的用户影响力评估算法改编成分布式并行化程序。论文用真实的从新浪微博平台爬取的数据在Hadoop集群上对论文提出的分布式并行化URank和PsoRank算法进行实验验证。实验结果表明,相对于其它的用户影响力评估算法,论文提出的用户影响力评估算法可以更公正合理地反映用户真实的影响力大小。并且集群性能分析结果也表明,论文提出的并行化算法具有良好的加速比和计算效率比。因此论文提出的分布式并行化用户影响力评估算法较适合像新浪微博这样的大型社交网络平台。
其他文献
数字签名技术是电子商务领域中的主要发展方向之一,且随着计算机与通信网络技术的迅速发展,数字签名已在信息保密、身份认证、不可否认性以及数据完整性等方面发挥了极其重要
随着Internet不断扩大以及新业务的涌现,网络技术对人们日常生活的影响越来越大,同时网络自身也在不断发生着变化。在Internet的变化中,最突出的就是网络从单纯的数据传送发
学位
Fourier变换在信号处理,光图像处理等众多领域中有着广泛的应用,分数阶傅里叶变换(Fractional Fourier Transform,FrFT)可被看为是广义的Fourier变换,它不仅具有Fourier变换
“光进铜退”成为运营商发展宽带接入的市场趋势。以太网无源光网络(EPON)系统因为其接入距离长、可用带宽高,成为解决全光网络最后一公里最具竞争力的技术方案。EPON融合了
多时相遥感图像分类主要是利用一幅有标签图像实现对采集于其他时相的无标签图像的分类(包括同源场景和异源场景图像)。多时相分类主要包含多时相图像对齐与对齐后数据分类两个方面。其中,多时相对齐是针对多时相遥感图像之间因成像环境不同造成的光谱漂移问题,通过变换统计分布方式,消除同类地物在不同时相上的分布差异,实现多时相遥感图像联合利用。多时相分类有效解决了要分类图像无标签下的图像解译问题,作为遥感图像分析
岩芯是研究地层信息最具价值的实物材料,目前岩芯已可以通过岩芯扫描仪实现数字化的采集与保存。但是现有岩芯扫描仪普遍存在着图像分辨率不高,价格比较昂贵等问题,本文针对
短波通信作为一个适用性非常广泛的技术,已遍布于民用和军事的各个领域。随着各方面技术的不断进步,现代短波通信正在向高速、宽带、强抗干扰能力、智能化、组网等方面发展,
伴随嵌入式技术的不断发展和现代通信网络技术的日渐成熟,我国医疗系统已进入了医疗信息化时代。为满足医疗服务的数字化、信息化、网络化,构建基于移动智能终端的无线信息系
现有的GPR电磁波在层状体系中的传播模型和介质参数反演过程没有一个统一的机制,使得研究人员需要依赖简化公式或根据经验人工调试参数进行GPR信号分析。并且,当前关于层状体