社交网络的用户关联技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dishunzhaopin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,社交媒体网站的日益普及促使越来越多的人参与到多个在线社交网络中,不同的在线社交网络平台以不同的功能吸引用户,如信息搜索、分享或社交联系等,为了更好地利用每个社交网络提供的服务,用户倾向于加入多个在线社交网络。如何将社交网络的多个用户身份关联起来作为社交媒体中的一项新兴工作,具有重要意义。  本文通过研究目前有代表性的用户关联模型,提出了一个基于综合信息的用户关联模型(BiALP),实现了一个基于大规模网络的用户关联系统。本文的主要贡献有:  1.提出一个基于综合信息的用户关联模型(BiALP),该模型通过节点表达的方法学习网络的内在结构信息、属性信息和内容信息,以源网络和目标网络的节点表达为特征,以已关联用户对作为带标签数据,采用二分类监督学习的方式学习源网络与目标网络之间的关联关系。  2.提出基于候选集生成的模型加速算法,对于源网络中的用户,首先根据属性特征生成目标网络中可能关联的用户候选集,再利用BiALP模型从候选集中选择关联概率较大的用户列表。本文提出了三个候选集生成算法:余弦相似度算法、Jaro-Winkler Similarity算法和局部敏感哈希算法。  3.将模型扩展到大规模数据的场景,构建一个基于大规模网络的用户关联系统,针对网络规模大、处理时延高的问题做出一系列优化,具体做法是将处理过程分为离线处理和在线处理,采用局部敏感哈希算法生成候选集,基于Spark计算引擎实现分布式BiALP模型。  大量实验表明,BiALP模型与目前有代表性的其他用户关联模型相比效果有明显的提升(35%),用户关联系统支持处理大规模数据,处理性能相比单机系统也有很大提升。
其他文献
随着全球汽车产量的逐年提高,相应地轮毂市场需求也在迅猛增长,国内80%的汽车轮毂是由铸造而成,铸造而成的轮毂需要进行精加工,而由混流生产线生产的轮毂在再加工时若对其类型进行
软件工程发展到今天,仍然有很多因素无法控制。如何有效的保证软件质量仍然是软件工程的重大难题,同时这也是决定项目成功与否的关键因素之一。对软件质量进行量化管理并客观的
学位
离散傅立叶DFT变换作为数字信号处理中最基本的运算之一,在很多领域中发挥着重要的作用,而快速傅立叶变换FFT作为DFT的快速算法使得傅立叶变换的运算量大大减少,且实现起来更方
随着分布式应用的迅速发展,不同硬件平台和网络环境,特别是不同数据库之间的互操作问题越来越复杂,为解决这一问题,业界提出了中间件的概念,如今已成为当前研究课题的一个重要方向
随着信息技术的不断发展和广泛应用,数据量呈爆炸式增长,网络存储系统越来越受到人们的关注。作为网络存储系统核心部件的集群文件系统,如何提供高吞吐率、高带宽、低延迟、高可
软件定义网络(SDN:Software-Defined Networking)采用了数据平面与控制平面相分离的开放式系统架构,可有效地简化网络的控制与管理,促进网络的创新。早期SDN控制平面向外提供低
DNS(Domain Name System,域名系统)作为互联网的基础设施,支持了绝大多数互联网应用的顺利运转,从根本上保障了互联网上各主机之间的互联互通。因此如何有效的实时监控域名服务
学位
互联网的蓬勃发展,加速了人类信息化时代的到来。在高度信息化的今天,大量庞杂的信息充斥着网络,而且信息的规模还在不断地急剧增加。因此人类希望能快速查询信息、准确获取信息
学位
J2EE无疑是当今社会炙手可热的企业应用框架,它的主要目的是实现可跨平台的大规模企业应用。网格计算是计算机研究领域中的一朵奇葩,它的主要目的也是实现大规模的资源共享。 
近几年来,深度神经网络发展迅猛,引起了包括学术界和产业界的广泛关注。这项技术在计算机视觉、语音识别以及自然语言处理等众多领域取得了巨大的突破,显著提高了算法在多种任务