论文部分内容阅读
随着信息技术的高速发展,在线社交网络平台也逐渐成为人们生活中不可或缺的一部分。社交网络在为人们建立社会网络和社会关系平台的同时也面临着越来越严重的Sybil攻击。Sybil用户通过操纵网络投票、发布大量广告信息等对社交网络的正常使用产生越来越多的消极影响。为了检测出隐藏在普通用户中的Sybil用户,研究者们提出了很多基于属性特征和行为特征的检测算法且都取得了较好的检测效果,但随着Sybil用户的伪装效果提升,仅仅从用户自身属性无法对用户的真实性作较为可靠的评价,而且这些方法忽视了不同属性对于用户真实性评价的重要程度上的区别。VoteTrust算法虽然解决了因Sybil用户入侵真实用户社区所导致的无法准确检测的问题但是该方法也无法应对基于关注-转发型社交网络中真实用户误关注率较高的问题。本文首先提出了一种基于加权支持向量机的Sybil群体检测模型,与现有Sybil检测模型相比,本文在选择用户属性进行机器学习方法求解时不仅考虑用户自身的属性特征,而且增加了用户所有关注者的属性特征,可以较为有效地检测出模仿真实用户属性的Sybil用户并且可以降低只选择自身属性时对相似于Sybil的真实用户的误判。根据在线社交网络中获取的用户数据进行的实验表明,本文选取的属性特征向量通过支持向量机方法得到的Sybil群体分类器相比现有的检测模型具有较高的准确率。然后根据用户属性特征提出了一种基于欧式距离的可信度求解模型。为了降低算法的复杂度,使得原理简洁明了,首先对Sybil用户的属性值范围进行统计并找出属性值范围中心,然后根据用户属性与该值的远近计算用户为Sybil的可能性值,模型采用ROC曲线对实验结果进行评价,发现属性可信度能较好地实现将Sybil与真实用户区别开来。模型的最后用凹凸函数对属性可信度进行优化,降低疑似Sybil群体的可信度值并同时提高疑似真实用户的可信度值,为行为模型提供更好的可信度参数。在属性可信度的基础上提出了一种将属性可信度值作为一个重要参数进行基于VoteTrust改进的用户真实度计算的Sybil群体模型。为了将VoteTrust方法应用到以关注转发为特征的社交网络中,本文将单向关注行为等同于发送好友请求,并引入属性特征来对用户可信度进行初步评价,对于如微博等在线社交网络,Sybil群体中的个体所关注的对象、被关注的对象或粉丝数都是不同的,根据这些属性,可以作为判断该个体在社交网络中是否为Sybil用户。然后根据真实用户几乎不会向Sybil用户发送关注请求进行真实度权值传播,得到Sybil分类结果。本文从新浪微博采集较新的实验数据,并手动标注Sybil节点进行分析建模,与最近发表若干检测算法作对比,结果表明基于属性可信度的行为特征的检测算法有较低误检率和较高的检出率。