微博恶意用户识别

来源 :北京交通大学 | 被引量 : 5次 | 上传用户:qq407606015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,以Facebook, Twitter为代表的在线社交网络成为了人们相互之间交流的重要途径。而在国内,微博更是成为时下最热门的在线社交网络。然而,微博中还充斥着大量的利用微博传递恶意信息、实施恶意行为的恶意用户,对微博生态和微博中正常用户的隐私和财产安全构成了威胁。因此,关于反恶意用户方法的研究具有很大现实意义,这其中就包括恶意用户识别技术。当前,微博恶意用户识别的研究主要集中在两个方面,一是基于恶意信息内容与统计特征分析,二是基于恶意用户的行为特征和用户关系。研究者们或从一个方向,或从两个方向同时着手,取得了大量的研究成果。然而目前的方法普遍只能利用二分类方法简单区分恶意用户与正常用户。本文承袭前人经验,从微博及其恶意用户行为研究入手,依照恶意用户行为策略,对恶意用户进行了更为系统的分类。结合博弈论建立了正常用户与恶意用户之间的行为博弈模型,并以模型为基础对微博用户的谨慎程度进行定量计算。通过谨慎度,强化了微博用户行为特征对正常用户和恶意用户的区分能力。最后应用基于置信度的多蚁群随机游走(CARW)算法对恶意用户进行识别。本文的主要工作包括以下几方面:首先,本文针对当前恶意用户分类不够清晰的现状,对恶意用户类型进行了更为系统的划分。研究过程中,通过更为多样的途径对微博中的恶意用户样本及相关数据进行采集,经过对用户样本在实施恶意行为过程中行为策略的观察与研究,重新划分恶意用户的类型。在此基础上,本文对各类用户的行为特征进行了定量分析和对比。随后,为了应对恶意用户针对当前识别方法做出的适应性改变,本文利用博弈论建立了正常用户与恶意用户之间的行为博弈模型,并通过行为博弈模型对用户的谨慎度进行了求解。利用谨慎度对用户的行为特征进行调整,有效抵消了恶意用户通过模仿普通用户行为对一般识别方法带来的干扰。通过实验证明,利用通过用户行为博弈模型求解出的谨慎度有效提高了识别算法的性能,综合提高比例达到5%。最后,针对传统恶意用户识别方法不能够对恶意用户进行多类分类的不足,本文在使用谨慎度对用户行为特征调整的基础上,采用CARW算法对微博中恶意用户进行识别。实验结果证明,算法不仅能够有效识别出微博中的恶意用户,还能够对其所属的用户类型进行归类。其中将恶意用户正确归类的准确率可以达到50%以上,识别出恶意用户的准确率接近90%。
其他文献
在当时社会,山西乔家云集了各地的能工巧匠,造房作舍,体现其精湛的技艺。不管是现在还是在过去,装饰都公认为民居建筑艺术表现手法之一,已无可厚非。主要体现在装饰手法的几
在数学教学中,我们经常看到,不少学生一接触到“解决问题”,便谈“问题”色变.新教材下“解决问题”该如何教学,笔者认为可以从策略的角度进行教学,认识策略、形成策略、应用
<正> 汉武帝在其执政的五十余年间,大规模地频繁地举行了封禅、祭祀、寻仙祀神等活动,司马迁在《史记·封禅书》中对此作了详尽的记载。汉武帝为什么要举行这一系列的封禅、
随着我国经济社会快速发展,城市化进程不断推进,国民生活质量得到有明显提升,但发展所带来的一系列问题也随之显现。目前,社会正处于带病运行状态,社会矛盾凸显,呈现出燃点低
卵巢癌是女性生殖器常见恶性肿瘤之一,由于早期缺乏典型症状,且筛查手段有限,故诊断十分困难,就诊时大多已发展为晚期,但晚期疗效又不理想。虽然卵巢癌的发病率居妇科恶性肿
通南巴构造带河坝场构造嘉二段、飞三段储层的压力系数多在2.0以上,为异常高压储层,异常高压主要分布在雷口坡组和嘉陵江组巨厚的膏盐岩盖层之下,封闭性能良好;断层对异常高压的
目的探讨利妥昔单抗治疗婴儿难治性自身免疫性溶血性贫血(AIHA)的疗效。方法回顾性分析郑州儿童医院2015年10月至2016年12月收治的5例AIHA病儿,采用利妥昔单抗治疗(每次375mg
航天快速发射内涵分析是理论研究的重要内容,针对目前航天快速发射内涵不清的现状,以航天快速发射的需求为切入点,明确航天快速发射的特征,梳理归纳出航天快速发射提供的4种
目的评价应用人工股骨头置换术治疗高龄股骨粗隆间不稳定型骨折的疗效。方法总结自2002年8月至2006年8月应用人工股骨头置换术治疗高龄、有明显骨质疏松的股骨粗隆间不稳定型
论文以江西省武夷山自然保护区黄岗山黄山松天然林为研究对象,根据黄山松实际的分布情况,共设置1200m、1400m、1600m、1800m、2000m五个海拔梯度,对黄山松细根生物量、碳(C)