社交网络中异常用户检测研究

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:blnxy541
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,社交网络已经渗透到人们生活、学习、工作、娱乐的各个方面,网络的多元化趋势使信息的传播方式越来越丰富。社交网络不仅将线下的社交活动拓展到线上,使得彼此间交流更为方便,用户更是可以通过社交平台展示自己以及获得热门资讯和自己感兴趣的话题。然而,为了获取利益,一些恶意用户正是利用社交网络平台的优越性传播一些恶意信息,如色情内容、垃圾广告、网络钓鱼等。这些恶意用户通过虚假账号或盗用正常用户账号的方式传播大量恶意消息,这种恶意行为严重影响了用户的上网体验以及用户的信息财产安全。如今,异常用户的泛滥已经成为社交媒体服务行业面临的一个严重问题。因此,社交网络的异常用户检测问题一直都是这些年来学者及商业界研究的热门领域。本文以新浪微博社交网络平台为研究对象,展开了对新浪微博平台异常用户检测的研究,主要完成了以下三方面工作,其理论方法亦适用于其它社交网络平台。(1)结合本文的研究目的,为了获得理想的实验数据源,我们利用Scrapy爬虫框架分别设计了针对正常微博用户和异常微博用户的个性化网络爬虫系统,实现了对用户的微博内容、用户信息、用户关系等数据的高效采集并实时导入MongoDB数据库中,并利用异常用户评判标准构建异常用户检测实验数据集。(2)本文通过探究新浪微博正常用户与异常用户的用户信息特征、行为特征,对正常用户与异常用户的数据进行深入分析,并结合领域知识提取新的特征,按需求进行特征提取、数据格式化等数据预处理操作。利用特征选择算法将所有特征按等级排序找出影响异常用户检测结果的重要因子,构建基于用户特征的异常用户检测模型,将加权投票的随机森林算法作为训练和检测模型,并将该模型与其他算法进行对比分析。(3)随机森林模型中参数的选取对模型性能的影响至关重要,传统的方法通常根据经验值来选取参数,无法确定是否达到实验的理想效果,为了确定模型的最优参数,我们引入标准粒子群算法(SPSO)来对模型的参数进行优化,构造基于SPSO优化的加权投票随机森林异常用户检测模型,使模型的检测性能得到显著提升。
其他文献
本文通过针对儿童在成长过程中所遇到的来自自身和环境中的安全问题,剖析现有的儿童智能穿戴产品,最终做出保护儿童安全的智能穿戴产品设计实践,以此来呼吁更多的人关注、关
<正>1临床资料患者女,14岁,左拇趾甲外侧结节,压痛3个月余。患者3个月前无明显诱因于左拇趾甲外侧长出一蚕豆大小结节,压痛明显。患者一般情况良好,无慢性病史。体检:系统检
随着FC,PCI-Express,RapidIO,Hypertransport等高速串行总线的快速发展,I/O模块对计算机的内部总线速度要求不断提高,高性能和高可靠性成为抗恶劣环境计算机设计中的一对矛盾
<正>营销实践表明:若一品牌同时具备目标消费者差异化和消费者价值差异化两方面意义,将形成竞争对手难以模仿的品牌定位,也会更持久保持差异化竞争优势。品牌建设的首要任务
空心墩墩顶实体段是空心墩结构中的重要部位,它承受上部结构的支座反力,并将反力传递给墩壁。大跨连续梁高墩由于刚度要求,上实体段纵桥向跨度大,且承受较大的支座竖向荷载,
本文从网络营销和传统营销差异出发,初步研究了网络营销与传统营销的有效整合方案。
文中针对港口工程钻孔灌注桩的施工,对钻孔灌注桩施工的准备阶段、钻孔阶段、钢筋笼的制作、混凝土的灌注进行了分析,并对工程中出现的问题进行了相应措施的处理,以确保施工
随着我国汽车工业和公路交通运输业的快速发展,轮胎的使用量迅猛增加,由此产生的废、旧轮胎数量也快速增长,并已成为我国新的主要固体废弃物污染源,被称为“黑色垃圾”。同时,作为
第一部分:兔VX2软组织肿瘤扩散加权成像与病理学对照研究目的建立恶性软组织肿瘤动物模型并初步探讨扩散加权成像(DWI)及扩散张量成像(DTI)诊断软组织肿瘤的可行性。材料与方法20
<正> 1958年冬,山东省文物管理处在东平县城北2.5公里大清河北岸王陵山的南坡,清理了一座汉墓。现将该墓的情况简介如下。