在线社交网络中异常帐号检测研究

来源 :西安电子科技大学 | 被引量 : 5次 | 上传用户:fairstone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络的方便快捷共享特性,使其成为人们生活中不可分割的一部分。目前使用社交网络展示自己、与好友交流、获取最新资讯已成为人们的一种习惯。然而,社交网络在带给人们各种便利的同时也吸引了攻击者的目光,成为攻击者获取利益的新平台。攻击者通过在社交网络中创建虚假帐号以及劫持正常帐号(我们统称为异常帐号)来发布广告、色情、钓鱼等恶意消息以及执行恶意点赞、批量关注等行为来获取利益,这些恶意行为严重影响威胁到正常用户的隐私信息安全、使用体验以及社交网络平台自身的信誉体系。针对这些问题,我们展开了在线社交网络中异常帐号检测的工作,重点研究在线社交网络中新出现的Photo Spam攻击方式的检测,并取得了如下一些主要成果:(1)分析总结了目前在线社交网络中异常帐号检测的研究工作。将异常帐号的生命周期分为创建、发展、应用三个阶段,然后根据异常帐号的表现形式将不同称谓的异常帐号统一在同一个框架中;总结了目前异常帐号检测研究的实验方法,包括数据获取方式、数据标识方式和结果验证方式;在此基础上深入分析了社交网络中新的攻击方式Photo Spam,分析了Photo Spam的攻击过程和攻击策略,并对比了Photo Spam与传统Spam,发现与传统Spam攻击相比,Photo Spam更难被检测到而且对正常用户的危害更大。(2)提出一种专门针对Photo Spam帐号的检测方案。Photo Spam是攻击者为了绕过社交网络现有检测系统的新式Spam攻击,具有Spam信息的存储与传播分离的特性,在攻击过程中有两类行为方式不同的Spam帐号参与。目前对Photo Spam的检测方案都是根据帐号行为方式进行检测,无法将两类Spam帐号都检测到。针对这一问题,我们首次提出了一种专门针对Photo Spam帐号的检测方案。首先通过对Photo Spam攻击的分析构造了基于用户信息和基于内容两方面的特征;然后利用这些特征设计了有监督学习的检测方案,通过包含2,046个帐号的数据集训练成为专门针对Photo Spam帐号的分类器,我们的分类器能够检测全部类型的Photo Spam帐号;最后将训练后的分类器应用到包含有85,148个帐号的真实数据集中,共检测到5,756个Photo Spam帐号,检测正确率为97.05%。(3)提出一种针对Photo Spam帐号的轻量级迭代检测算法。社交网络为了保护正常用户的个人信息安全和使用体验,需要在有限的时间内降低Spam帐号的比例,而目前采用数据挖掘的检测方案要对所有用户都进行深入检测,将耗费大量的时间和机器成本,无法满足这一现实需求。针对这一问题,我们首次提出一种针对Photo Spam帐号的轻量级迭代检测算法LIDA。LIDA包括目标筛选和内容检测2个步骤,通过目标筛选根据已知Spam帐号获取更多可疑帐号,通过内容检测对可疑帐号进行深入检测判断是否的确为Spam帐号。LIDA只对可疑帐号进行深入检测,避免了对社交网络中所有用户都进行检测的问题,实现了对Photo Spam帐号的轻量级检测。通过人人网的4次迭代实验,共检测到9,568个Spam帐号,检出率为18.84%,比基于数据挖掘的检测算法更加高效。(4)提出一种针对社交网络中Spam相册的检测方案。目前检测Photo Spam的方案都是针对Spam帐号进行检测,检测依据主要是帐号的恶意行为,因此需要Spam帐号存在一定时间之后才能够检测到,而在此期间Spam帐号的恶意行为已经对正常用户造成了危害,所以针对Spam帐号的检测方案滞后于Spam攻击,无法有效保护正常用户。针对这一问题,我们首次提出一种针对Spam相册的检测方案。首先基于Spam相册和正常相册的差异构造了12个提取及时且计算高效的特征;然后通过这些特征设计了针对Spam相册的检测模型;利用包含2,356个相册的数据集训练形成Spam相册分类器,实验表明能够正确区分测试集中100%的Spam相册和98.2%的正常相册;最后将检测模型应用到包含315,115个相册的真实数据集中,共检测到89,163个Spam相册,正确率达到94.2%。
其他文献
第十一届有效教学研讨会提出的主题为"从‘被动学习’走向‘能动学习’"。在观摩上海市普陀区有关学校的现场教学活动后,与会者就能动学习的时代背景、概念内涵、实践意义进
<正>在研究、评论与推广儿童文学这一领域中有很多不同分工的成人参与其中,他们都对于儿童文学的发展贡献着自己的所学所能。无论在高校任教的专职儿童文学教师还是在读的儿
环境生产力论是中国化马克思主义的重要主张。论文在阐述中国化马克思主义关于环境生产力相关观点基础上,对如何理解环境生产力论、环境生产力论的重要依据和重要价值等问题
截至11月上旬,青海油田今年陆续投产的13口水平井显示出强劲活力,单井产量是同油藏、同区块相邻直井的2至4倍,提高了油田开发效益。
弗兰德斯互动分析系统被用来记录和分析教学中师生言语互动的过程以及产生的影响,并通过量化的数据分析判断课堂教学的结构、教师教学倾向和教学风格等。但是,在幼儿园绘本教
由新疆石油管理局钻井工艺研究院承担的哈萨克斯坦北布扎奇油田中短半径开窗侧钻水平井钻井配套技术服务的NB31井,于2004年12月8日顺利完钻。
目的探讨Mtwo机用镍钛锉行磨牙根管预备和传统不锈钢K锉行磨牙根管预备的优劣差异。方法选择2015年8月~2017年8月我科需要进行磨牙根管治疗的患者96例(100牙)为研究对象,按照
随着大数据时代的到来,各种网络平台、多媒体深刻影响着大学生群体的学习、生活。他们的人际交流、学习、消费、娱乐等行为模式也发生了变迁,高校思想政治教育工作应树立大数
以广东省郁南县的无核黄皮为主要原料,研究了发酵型黄皮干型果酒的工艺。结果表明,采用带果皮发酵工艺,黄皮打浆后添加50%软水调酸后,添加0.08%的B-3果胶酶酶解24h,添加活化
特高压直流输电作为目前直流界的热点话题,在许多方面都有其不同于常规直流工程的地方。主要从工程设计的角度阐述了特高压直流工程相比于常规±500kV直流工程的设计特点。