基于行为分析的社交网络异常账号的检测

来源 :北京交通大学 | 被引量 : 9次 | 上传用户:ythaohaizi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,社交网络平台(以下简称"社交平台")逐渐成为我们日常生活中重要的社交工具。社交平台的类型、内容丰富多样,覆盖了社会上各类阶层的用户群体,一些流行且影响力较大的社交网络平台吸引了亿万用户注册登录使用。社交平台在某些方面给予了用户极大的便利,比如减少了用户间沟通空间与时间的距离,但是社交平台存储的巨量用户信息也成为了不法分子或者利益集团的目标,特别是针对社交平台存在的各类的异常账号进行恶意地发布或转发不良信息,给社会和公众造成了极大的损害。针对此种情况,社交平台需通过主动、定时的检测平台的用户行为数据,对异常账户判定和处理,将具有极其重要的作用与意义。本文在梳理了国内外社交网络用户行为分析相关成果的基础上,选择了新浪微博数据作为数据信息来源,利用隐马尔可夫过程对异常用户进行建模与检测,并对检测数据进行统计分析。首先,通过论证与对比,选择利用网络爬虫技术对新浪微博的用户行为数据进行了采集、处理,基于链接的网页分析算法,设计微博信息爬取技术框架,应用Python语言及MySQL数据库技术,通过获取微博URL地址、建立用户列表、自动登录微博,实现抓取微博信息。根据数据用户账号的特征,对数据进行了分析。然后遴选隐马尔可夫模型作为社交网络平台用户行为分析模型。提出并创建了基于隐马尔可夫过程的对社交网络异常用户行为进行检测的模型。通过获取的新浪微博数据对该模型进行训练,得到训练模型参数,利用模型进行用户行为的检测,对微博异常用户进行检测与判定,通过不同的可观察序列对隐变量状态最大概率路径进行计算与判定,从而从数据集分辩出正常和异常用户。并对检测数据进行了统计特性分析,实验证实该模型可有效检测出微博数据的异常账号。根据微博用户行为特征,选择微博特定特征的虚假粉丝,对隐马尔可夫模型进行训练,并进行虚假粉丝的检测,实验表明该模型可有效检测出社交网络微博用户具有特定特征的虚假粉丝账号,证实基于隐马尔可夫过程的具有特定特征的虚假粉丝账号正确检测概率要大于通常意义下异常账号正确检测概率。最后对基于隐马尔可夫过程的异常账号检测系统进行了设计与实现。系统可以对异常账号、虚假粉丝、过度关注、过度转发和过度广告用户进行检测,可以选择不同的隐变量和可观察变量维数及参数,为基于隐马尔可夫过程的异常账号深入研究奠定基础。
其他文献
本文对我国的一种地方名特优产品—传统宣威火腿的理化指标进行了分析,并用同时蒸馏萃取法(SDE)萃取成熟火腿中的挥发性化合物,用气相色谱/质谱(GC/MS)进行分离和鉴定。结果
对于生育权冲突问题的研究及提出有效的解决方法随着社会发展逐渐成为当下较为紧迫的任务,研究和解决生育权冲突有助于构建社会主义和谐家庭,使家庭成员之间更加和睦。本文从
<正>2015年11月底召开的中央军委改革工作会议,可谓一石激起千层浪,不仅国内舆论为之聚焦,国际舆论也穷追不舍。之所以引起如此大的反响,主要是因为,一方面,人们对军队的改革
随着新课程标准的不断深化和社会对人才的高质量要求,高中学校更加注重学生的专业素养和综合能力的培养。高中英语作为高中的一门重要课程,关乎学生的高考和以后的工作发展,
<正>2013年4月26日,全国农村五保供养服务机构建设管理推进会在山东聊城市隆重召开。来自部分省民政厅(局)分管厅(局)长、各省业务处长和民政部有关司局同志参加了会议。会议
系统对比研究了大叶相思、马占相思、厚荚相思及纹荚相思4种相思树硫酸盐法制浆性能及无元素氯(ECF)漂白性能.结果表明,采用硫酸盐法制浆,用碱量(氧化钠计)16%、硫化度25%时,
针对武汉Ⅰ级阶地地区某临近桥区(长范围、小间距)的地铁工程代建连续墙结构存在的诸如围护结构缺失、掉斗、混凝土浇筑超欠方、浇筑时间过长等情况,从产生原因及安全隐患方
数字化优质教学资源在教育信息化和提高高校教学质量中发挥着重要作用。文章通过分析数字化优质教学资源的三个属性,对其共建共享机制进行了优化分析,以促进其可持续利用与发
有效性是质量体系认证工作的出发点和落脚点。我国企业质量体系认证的有效性较差,原因有多方面,但根本原困在于企业内部。本文从企业管理内部分析了影响质量体系认证有效性的原
产生于远古时代的中国古代道德体系与伦理规范模式是与其特定的历史文化背景、地理经济条件和社会组织结构相对应的。做这样的定位很重要,因为中国古代伦理对于此后的社会发