基于网络结构的跨社交网络用户识别技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:guchenbing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,社交网络已得到了极大的普及,用户通过社交网络可享受各类社交服务,如豆瓣为用户提供图书、电影、音乐分享服务,知乎提供问答服务,微博提供自媒体广播服务,用户为满足不同的服务需求,往往不会局限于单一社交网络中,而是参与到多个社交网络活动之中。因此,跨社交网络用户识别问题逐渐引起了学者的关注,跨社交网络用户识别将有效集成分散于各个网络中的用户资源,大大提高用户推荐、广告投放、用户组形成等以用户为中心的服务质量。
  在传统的基于结构的跨社交网络用户识别方法中,现有方法大多通过提出有效的用户相似性函数,以评价用户是否匹配,主要存在以下不足:(1)现有方法大多利用用户局部结构信息或全局结构信息作为用户识别指标,难以实现用户识别精度与计算时间代价的平衡;(2)现有方法大多为启发式算法,仅针对特定跨网络用户识别问题进行研究,适用性受到限制,无法保证算法在不同类型网络中的普适性。为此,本文从四个方面对基于结构的跨社交网络用户识别方法进行改进:
  (1)提出了基于SimRank的跨社交网络用户识别方法。首先,提出了基于SimRank的跨网络用户相似性,精准衡量跨网络用户相似性,通过参数调节可有效平衡识别精度与时间代价。其次,构建了两阶段的迭代式匹配算法,第一阶段,计算候选匹配用户相似性,第二阶段,构建最优匹配策略,识别新匹配用户。在该算法中,着重针对算法复杂度过高的问题进行了优化,提出了增量式的用户相似性计算方法,并讨论了候选匹配用户过滤条件。最后,使用真实数据集进行实验评估,结果表明,基于SimRank的跨社交网络用户识别方法明显优于现有其他基于结构的跨网络用户识别方法。
  (2)提出了基于双向验证的跨社交网络用户识别方法。首先,提出了三种不同的相似度算法CPS、CPS+和CCS,并利用对齐网络模型,证明了具有最高CPS或CPS+相似性的候选用户大概率为匹配用户,以及具有较低CCS的已匹配用户大概率为错误匹配用户,保证了算法的适用性。其次,利用CPS+和CCS,提出了基于双向验证的迭代式跨网络用户识别方法,在每次迭代过程中,利用CPS+进行新用户识别,利用CCS检测错误匹配用户。同时,研究了迭代收敛性以及迭代终止条件的问题,有效平衡识别结果的准确率与召回率。最后,实验结果表明,该算法识别准确率与召回率优于基于SimRank的跨社交网络用户识别方法。
  (3)提出了基于最大公共子图的社交网络用户识别方法。首先,将社交网络用户识别问题抽象为最大公共子图问题α-MCS,并结合对齐网络模型,提出求解自适应参数α的方法,相比于传统基于启发式定义参数α的方法,该方法可有效区分不同类型网络中匹配用户与非匹配用户。其次,为快速准确地解决α-MCS,提出了基于最大公共子图的迭代式社交网络用户识别方法,该方法每次迭代过程包含两个阶段,第一个阶段,分别在两个社交网络中选取各自的候选匹配用户,第二个阶段,针对候选匹配用户进行识别,相比于其它算法,该算法时间代价低,且依据不同网络特征,通过参数估计,可保证较高识别精度与适用性。最后,实验结果表明,该算法在保证准确率与召回率的基础上,大幅度地提升了处理速度。
  (4)提出了基于生成概率的社交网络用户识别方法。首先,依据对齐网络模型,提出了社交网络生成概率的概念,并认为生成概率最大的用户匹配策略为最优匹配用户。其次,利用该思想,提出了基于生成概率的迭代式社交网络用户识别方法,在每次迭代过程中,仅针对可提高生成概率的用户进行匹配,有效提升了识别精度与效率。最后,实验结果表明,该算法处理时间代价略高于基于最大公共子图的社交网络用户识别方法,但识别准确率与召回率明显优于大部分方法。
其他文献
学位
学位
近年来,随着高光谱遥感技术的快速发展,基于高光谱图像的分类技术在目标检测、环境管理、矿物测绘中发挥着极其重要的作用,这些应用通常需要对特定场景内的图像进行分类。一些学者已将表示学习应用于高光谱图像分类,但传统的高光谱图像分类仍存在一些挑战和局限:(1)高光谱图像的维度比多光谱图像大得多,而传统的表示学习技术是专门为多光谱图像设计的,利用传统的技术对高光谱图像进行处理效果会受到一定程度的制约;(2)
学位
学位
高光谱图像的分类应用在地质勘探,城市扩张,农业和林业监测,军事等行业中起着至关重要的作用。高光谱图像具有优良的光谱信息和丰富的空间信息,其特征质量是影响分类性能的关键因素之一。由于特征的类内差异以及广泛的光照和规模变化,分类问题仍然具有挑战性。因此,如何从高光谱数据中提取本质特征是本文的主要研究重点。主要工作如下:(1)高光谱图像由于其光谱维数高,相关性强,数据量大等特点,在特征提取方面有很大的难
学位
学位
随着互联网的快速发展,信息与通信技术的日益提高,使得基于互联网的服务与应用和人们的生活越来越密不可分。社会网络、经济、医疗保健、工业和科学等领域产生海量数据,加上网络边界的消失以及攻击类型的多样化,增加了网络入侵的风险。如果没有敏捷的安全基础设施,基于物联网技术发展的智能城市将无法可靠运行。网络入侵检测系统(Intrusion Detection System,IDS)已成为监控网络活动和检测入侵
学位
信息爆炸时代的来临和云存储的高速发展造成了数据量成倍的增长,物联网的发展也使物和物之间增多了联系,信息技术的蓬勃发展带来了社会的欣欣向荣,同时都造成了数据量日益增加,数据存储的承载量和存储设备可靠性问题受到业界人们的关注,科研人员希望寻找有效的办法来应对这类挑战。RAID-6存储系统相比其它的RAID存储系统具有更高的数据可靠性,通过纠删码在RAID中的应用,设计出高效的扩容方案一直探索的方向。在
学位
The goal of this thesis is to examine how video games are designed and to see how different game mechanics work and how to use them in the development of a game,as well as examine what are both the po
学位
In recent years, image recognition has become important in computer vision and image processing.Additionally, it is used in many fields such as driverless vehicles, healthcare, face recognition, searc