基于数据挖掘的识别社交网站Sybil攻击的算法研究

来源 :南京邮电大学 | 被引量 : 2次 | 上传用户:zeiwu158
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线社交网络技术的快速发展,网络社交已经成为大多数人必不可少的生活方式。在利益的驱动下,针对社交网络的攻击也变得越来越频繁。与单个用户相比,由多个用户合谋发起的Sybil攻击破坏性更强。Sybil用户团体特点是组织性和结构性都很强,团体内的用户会几乎同时段对相同目标店铺发起Sybil攻击,这种Sybil攻击能够在较短时间内对目标店铺声誉评分造成巨大变化,声誉评分急剧上升或是下降取决于Sybil活动的雇佣者是店铺本身还是其竞争对手。无论结果如何,都对正常的市场秩序造成了损害。因此需要一种有效的识别在线社交网络中Sybil攻击的方法。本论文主要研究了如何有效识别社交网络中的Sybil攻击的算法。本文以用户评价类社交网站大众点评网为研究对象,设计了基于改进的逻辑回归算法的识别社交网站的Sybil攻击的方案。首先爬取大众点评网上一段时间内用户对排名靠前商家的评论数据,获得了用户评价数据集。数据的采集用到了网上现有的采集工具。其次对获取的数据集进行了数据清洗工作,包括对数据集里面的缺失值、异常值、重复数据等脏数据进行处理。获得可以使用的评价数据集,为接下来的特征分析、模型构建和实验验证等工作做了准备。然后对数据特征进行了分析研究,主要是用户属性特征和用户行为特征,包括用户等级、用户对店铺的总体评分和服务环境等分项的评分情况、用户是否为会员、评价时间、评价获得他人的点赞数量和他人回复的数量等特征。对这些特征的结构进行了分析处理,研究了各个特征的数据分布情况。通过增加用户行为属性的分析,可以有效构建Sybil攻击识别模型。因为识别社交网站Sybil攻击可以简化为将所有用户进行分类,识别出用户为正常用户或者是Sybil用户。而逻辑回归算法非常适合用来做分类问题,所以构建了基于逻辑回归算法的识别社交网站Sybil攻击的模型。为了防止出现过拟合,对算法进行了改进,加入了正则项。将处理过的数据集分为训练集和测试集,对构建的模型进行了训练。通过实验,验证了改进的逻辑回归算法能够更好地识别Sybil用户。
其他文献
合同漏洞是指合同内容的不完满。针对合同漏洞的填补,制定法除规定任意性规范外,还规定了整体解释和适用交易习惯这两种补充解释方法。而在上述方法无法填补合同漏洞的情况下
学位
我国每年出生的先天性心脏病(先心病)儿童高达30万,特别是在医疗条件低下的西部高海拔山区,普遍存在高发病率,低筛查率的医疗现状,给儿童生长发育带来了严重的威胁。考虑到心
本文讨论了一类带有强阻尼项和源项的非线性高低阶耦合Kirchhoff方程组的长时间性态问题,主要围绕方程组的整体吸引子、指数吸引子和惯性流形三个方面展开讨论.在适当的假设下,通过先验估计和Galerkin方法得到方程组在E-1=H02(Ω)XH-02m(Ω)×H-01(Ω)×H-0m(Ω)上存在唯一解,从而获得方程组的解半群,并进一步获得了解半群存在整体吸引子.在方程组整体吸引子研究的基础上,验证
学位
医学成像是临床医疗中一项重要的技术,其以非侵入式的方式对人体内部器官及组织进行成像,具备易于操作、重复性高、非创伤性等等优点,从而为诊断和治疗提供有效的依据。医学
魏家峁露天煤矿西南工作帮于2018年年底出现滑坡失稳现象,因受征地影响不能向前推进,影响露天煤矿安全生产及年度生产任务完成。论文以此为背景,综合运用现场调研、工程勘探、岩土试验、理论分析、刚体极限平衡法及数值模拟相结合的方法,研究了魏家峁露天煤矿西南工作帮滑坡机理,制定了西南工作帮滑坡治理方案,保证了魏家峁露天煤矿安全生产,圆满完成了年度生产任务。论文所采用的研究方法及所得到研究结论对类似工程条件
学位
在高速光接入传输系统中,目前已接近传输能力的基本极限,因此将光接入与当前研究热点——空分复用相结合,对实现更高速的光接入有重大意义。本文在无源光网络中,用少模光纤中
分数阶微分方程是整数阶微分方程的推广,近年来受到许多研究者的广泛关注是因为其可以更为准确地刻画许多物理现象.而脉冲微分方程又是描述在固定时刻发生快速变化或跳跃的物理现象,在现实生活中有着广泛的应用.基于此,本文主要应用莫尔斯理论、临界点理论等方法研究几类具阻尼项的脉冲分数阶微分方程边值问题解的存在性与多解性,给出保证其解存在的充分条件,并举例说明所给条件的有效性和合理性.本论文首先介绍分数阶微积分